利用python抓取京东的数据

# -*- coding: utf-8 -*-
import json;
import urllib.request;

from pandas import Series;
from pandas import DataFrame;

from bs4 import BeautifulSoup;

response = urllib.request.urlopen('http://item.jd.com/1185294.html');

html = response.read();
html

soup = BeautifulSoup(html);
soup

divSoup = soup.find(id="product-detail-2")

data = DataFrame(columns=['Feature', 'Property'])

trs = divSoup.find_all('tr');

for tr in trs :
    tds = tr.find_all('td');
    if len(tds)==2:
        f=tds[0].getText();
        p=tds[1].getText();  
        data = data.append(Series([f, p], index=['Feature', 'Property']), ignore_index=True);

len(data)   

response = urllib.request.urlopen('http://p.3.cn/prices/get?skuid=J_1185294');
jsonString = response.read();

jsonObject = json.loads(jsonString.decode())

jsonObject[0]['p']
 
 
 
说明如下  python3.4.3   商品信息都可以读取出来,但是最新价格没了  因为商品已经下柜  出了新版本 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值