python获取网页元素坐标_Python实战爬虫系统学习笔记一：解析网页中的元素

weixin_39719127

于 2020-12-17 12:24:34 发布

阅读量617

点赞数

文章标签： python获取网页元素坐标

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39719127/article/details/111449107

版权

学习python编写爬虫第一天，学会如何解析本地网页

第1步：使用用Beautiful Soup解析网页

Soup = BeautifulSoup(wb_data,'lxml')

第2步：描述爬取信息的位置

这里使用浏览器开发者工具，选取元素，右键->Copy selector

Copy selector

可得到"body > div.main-content > ul > li > img"

代码如下：

images = Soup.select('body > div.main-content > ul > li > img')

第3步：从标签中获取所需要的信息

from bs4 import BeautifulSoupwith open('/Users/new_index.html','r') as wb_data: Soup = BeautifulSoup(wb_data,'lxml') images = Soup.select('body > div.main-content > ul > li > img') titles = Soup.select('body > div.main-content > ul > li > div.article-info > h3 > a') descs = Soup.select('body > div.main-content > ul > li > div.artic

最低0.47元/天解锁文章

weixin_39719127

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python获取网页元素坐标_Python实战爬虫系统学习笔记一：解析网页中的元素

学习python编写爬虫第一天，学会如何解析本地网页第1步：使用用Beautiful Soup解析网页Soup = BeautifulSoup(wb_data,'lxml')第2步：描述爬取信息的位置这里使用浏览器开发者工具，选取元素，右键->Copy selectorCopy selector可得到"body > div.main-content > ul > li &g...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。