利用CSS选择器和BeautifulSoup抓去京东网商品信息

最新推荐文章于 2021-08-12 21:11:09 发布

如瑜得水

最新推荐文章于 2021-08-12 21:11:09 发布

阅读量283

点赞数

分类专栏：前端CSS 文章标签： CSS选择器 BeautifulSoup 数据挖掘 Python

本文链接：https://blog.csdn.net/qq_21325977/article/details/80782772

版权

知识点：

Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库
CSS选择器

步骤：

环境要安装好BeautifulSoup，具体可以看官网文档
进入京东网，输入要查询的商品，向服务器发送网页请求。这里用“笔记本”
检查网页源码，利用CSS选择器复制数据

具体代码：

import numpy as np
from urllib.request import urlopen
from urllib.parse import quote
from bs4 import BeautifulSoup

def get_product(keyword):
    url = 'https://search.jd.com/Search?keyword='+ quote(keyword) + '&enc=utf-8'
    html = urlopen(url).read().decode('utf-8')
    soup = BeautifulSoup(html,'lxml')
    items = soup.select('li.gl-item')
    for i in range(1,len(items)):
        title = soup.select('div.p-img > a')[i]['title']
        print('title: ', title)
        url = soup.select('div.p-img > a')[i]['href'].split(&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

如瑜得水

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
利用CSS选择器和BeautifulSoup抓去京东网商品信息

知识点：Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库CSS选择器步骤：环境要安装好BeautifulSoup，具体可以看官网文档进入京东网，输入要查询的商品，向服务器发送网页请求。这里用“笔记本”检查网页源码，利用CSS选择器复制数据具体代码：import numpy as npfrom urllib.request import urlopenfro...
复制链接

扫一扫