爬取财富500强的数据,用xpath定位,爬取两层链接
文章目录前言一、Xpath定位1.安装lxml2.引用etree3.代码示例4.解读xpath4.html结构二、使用步骤1.引入库2.拼接第二层链接的url三、完整代码前言这篇文章的爬取对象是2021年《财富》中国500强排行榜 ,里面的数据是封装在两个页面里的,需要爬取两层链接。一、Xpath定位应用的是lxml里的etree库,简单的应用笔记链接1.安装lxmlpip install lxml2.引用etreefrom lxml import etree3.代码示例#
原创
2021-10-20 15:11:37 ·
849 阅读 ·
0 评论