使用BeautifulSoup中的select选择器定位数据

最新推荐文章于 2024-07-17 14:11:27 发布

哦啦哦啦！

最新推荐文章于 2024-07-17 14:11:27 发布

阅读量2.1k

点赞数 1

分类专栏： Python 文章标签：爬虫

本文链接：https://blog.csdn.net/weixin_42240667/article/details/98034633

版权

Python 专栏收录该内容

16 篇文章 2 订阅

订阅专栏

定位数据时需要使用浏览器的开发者模式，将鼠标定位停留在对应的数据位置并右击，然后在快捷菜单中选择“检查”命令（这里应浏览器而变，例如我的搜狗浏览器是叫审查元素）
下面的例子采用中国旅游网
在这里插入图片描述
接下来右侧会弹出开发者界面，右侧高亮代码对应前面数据位置，在弹出的快捷菜单中选择’Copy’ > 'Copy Selector’命令，便可以自动复制路径，然后粘贴即可

下面放下获取所有头条新闻的代码

import requests
from bs4 import BeautifulSoup  #从bs4库中导入Beautiful Soup
url ='http://www.cntour.cn/'
strhtml = requests.get(url)
soup = BeautifulSoup(strhtml.text,'lxml')  #lxml解析网页文档
data= soup.select('#main > div > div.mtop.firstMod.clearfix > div.centerBox > ul.newsList > li > a')
#获取数据，其中select中的参数就是前面获取的路径
print(data)