智策网分享如何利用python抓取百度贴吧相关信息
智策网分享如何利用python抓取百度贴吧相关信息
今天智策网给大家分享一下如何利用python抓取百度贴吧相关信息
为了演示,我就随便在iphone贴吧找了一个内容相对丰富的帖子。
智策网只是演示,所以我选择抓取
回帖时间
回帖内容
回帖时
这3个信息,其实比较聪明的人应该知道,智策网这个可以做信息聚合,标题+这些回复内容不就是一篇原创信息。
先分析一下思路:
1、获取单个页面的源代码
2、大概看一下页数,当然我们也可以用正则获取
这里举例,我看了一下有733页的信息,演示我就抓取前100页吧。
3、信
原创
2020-07-16 10:27:08 ·
175 阅读 ·
0 评论