2016年6月23日 星期四

淘寶GET擷取分析

開啟淘寶首頁進行搜尋:皮繩

GoogleChrome/開發人員工具/Network

Headers:

  1. Request URL:
    https://s.taobao.com/search?q=%E7%9A%AE%E7%B9%A9&commend=all&ssid=s5-e&search_type=mall&sourceId=tb.index&area=c2c&spm=a1z02.1.6856637.d4910789
  2. Request Method:GET

發現他是使用 HTTP請求 裡面的GET

Postman可以確認Request URL細節
https://www.getpostman.com/docs/install_mac

打開Jupyter

new 一個Python2的py檔

In[1]:

import requests

res = requests.get("https://s.taobao.com/search?q=%E7%9A%AE%E7%B9%A9&commend=all&ssid=s5-e&search_type=mall&sourceId=tb.index&area=c2c&spm=a1z02.1.6856637.d4910789")

print res.text


chrome套件

SelectorGadget

https://chrome.google.com/webstore/detail/selectorgadget/mhjhnkcfbdhnjickkkdbjoemdmbfginb?hl=zh-TW


用Safari檢閱按右鍵檢視元件更快


在class="grid"的div

有0~43共44個方格子
每個方格子都是一個,data-index="0"中的數字為編號0~43
<div class="item " data-category="auctions" data-index="0">….</div>

圖片
data-spm-anchor-id="a230r.1.14.1"

圖上雙橘按鈕區塊 div.similars
找同款data-spm-anchor-id="a230r.1.14.2"
找相似data-spm-anchor-id="a230r.1.14.3"
價格.g_price strong
幾人收貨:class="deal-cnt"

圖片的屬性:
ClassName= J_ItemPic img

baseURI: "https://s.taobao.com/search?q=%E7%9A%AE%E7%B9%A9&commend=all&ssid=s5-e&search_type=mall&sourceId=tb.index&area=c2c&spm=a1z02.1.6856637.d4910…"

alt 送銀扣蠟皮繩水晶吊墜項鏈掛繩男女手工編織黃金翡翠玉珮黑紅繩子
class J_ItemPic img
id J_Itemlist_Pic_38694171862
data-src//g-search2.alicdn.com/img/bao/uploaded/i4/i3/TB1wDPVFVXXXXX.XFXXXXXXXXXX_!!0-item_pic.jpg
src //g-search2.alicdn.com/img/bao/uploaded/i4/i3/TB1wDPVFVXXXXX.XFXXXXXXXXXX_!!0-item_pic.jpg_460x460Q90.jpg

沒有留言:

張貼留言