- 博客(3)
- 收藏
- 关注
原创 python分析并爬取起点中文网的章节数据,最后保存为txt文档
如题,分析起点中文网,并提取出来章节链接,保存为txt文档。代码仅供交流使用,请勿用作商业用途,如有违规,请联系删除一,分析1.打开带有章节的链接,例如:(随便选的一篇文章)2.打开浏览器的抓包工具f12(我用的是谷歌浏览器),点击页面的免费试读,因为页面是在一个页面跳转,不需要多开浏览器。抓到包会发现很杂乱,通过筛选会出现所需要的一些链接,这些链接一个个点击查看返回详情,最后发现那条蓝色链接是包含所有这篇小说的目录的。3.可以发现这个是一个get包,变化的参数有两个。4
2020-09-20 20:15:01 1555
原创 python分析并爬取今日头条的视频链接
如题,分析并爬取今日头条的视频链接代码仅供交流使用一.分析1.进入现在的官网http://www.365yg.com/,然后通过抓包发现首页数据的走向,一般来说首页数据放在网页中,要不然就是用json返回的。可以发现并没有看到任何首页的数据,就剩下在json了通过开发者工具的筛选xhr数据,然后发现返回这两条链接,第一条被排除了,就只剩下第二条链接,看到返回内容,发现其中data中的id跟首页视频跳转的id并不对应,再分析其他几个,发现是时间戳,最后只有raw_data没有显示任
2020-09-12 16:53:34 3029 1
原创 用python爬取某q音乐的评论
如题,用python爬取q音乐的评论内容(新人第一次发帖,有错误的地方请指正,谢谢了)代码中并没有什么难度,发帖是为了互相交流学习一下,有需要的可以去试一下下面是全部的代码情况,引用的就只有三个库:requests,re 和 time,里面具体的代码都进行了简短的解释说明,目前代码里只提取了评论的昵称,评论内容和评论的时间,其他内容的话可以自己去试着提取。下面访问的链接都是可以抓取到的# 代码仅供交流使用,请勿非法使用import requestsimport reimport ti
2020-07-26 11:57:35 460
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人