爬虫
奋斗吧穷孩子
这个作者很懒,什么都没留下…
展开
-
进阶的爬虫系列 ——贴吧爬取术
进阶的爬虫系列——不得不说的贴吧爬取术感谢各位能点开我的这篇博文,才开始写,这个算是很简单的爬虫,文中如有错误和不足欢迎各位大神多多包涵指正,大家的建议是我不断前行的动力,废话不多说我们直接进入主题。目标:爬取贴吧数据步骤:首先我们进入百度贴吧的页面,通过进入不同的贴吧以及翻页解析其url的变化规律通过观察我们可以看出 “kw=”的后面是接的贴吧的名字,而“pn=”的后...转载 2019-09-07 22:02:26 · 458 阅读 · 0 评论 -
Python爬虫:Xpath语法笔记
一、选取节点常用的路劲表达式:表达式 描述 实例 nodename 选取nodename节点的所有子节点 xpath(‘//div’) 选取了div节点的所有子节点 / 从根节点选取 xpath(‘/div’) 从根节点上选取div节点 // 选取所有的当前节点,不考虑他们的位置 xpath(‘//div’)...转载 2019-09-09 11:39:22 · 159 阅读 · 0 评论