如何从京东商品里获取需要的信息

如在京东上瞧上一款平板,网页为 http://item.jd.com/1185294.html


要把里面的规格参数抽取出来,我们使用python3


首先导入一些模块

import json,urllib.request

from pandas import Series

from pandas import DataFrame

from bs4 import BeautifulSoup



抽取网页信息

response = urllib.request.urlopen('http://item.jd.com/1185294.html')
html = response.read()
 
soup = BeautifulSoup(html);
divSoup = soup.find(id="product-detail-2")
data = DataFrame(columns=['Feature', 'Property'])
trs = divSoup.find_all('tr');
for tr in trs:
    tds = tr.find_all('td')
    if len(tds)==2:
        f=tds[0].getText()
        p=tds[1].getText()  
        data = data.append(Series([f, p], index=['Feature', 'Property']), ignore_index=True)

print (data)




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值