- 博客(2)
- 收藏
- 关注
原创 Python Selenium简单爬取虎牙直播弹幕(仅学习)
目录前言一、爬虫思路二、使用步骤1.引入库2.通过selenium进入直播间3.分析HTML4.实现伪监听总结前言学习python的第二周,在此记录学习进程:这次有了需求,由于要做主播的视频剪辑,但是虎牙提供的弹幕热力流在长时间轴中极不敏感,很难快速在6个小时的录播中找到热点,因此打算直接使用爬虫爬取直播弹幕。本文内容仅用于学习,请勿商用一、爬虫思路直播界面的弹幕和礼物都不需要登录态,因此不需要借助cookie;但是直播本身是使用了socket,而且初步研究之后觉得使用socket破解加密
2021-01-28 17:45:42 6173 9
原创 Python简单爬取起点中文网小说(仅学习)
目录前言一、爬虫思路二、使用步骤1.引入库2.读取页面3.分析HTML3.从标签中取出信息4.爬取正文总结前言实习期间自学了vba,现在开始捡回以前上课学过的python,在此记录学习进程本文内容仅用于学习,请勿商用一、爬虫思路无需登录的页面只需要用到简单爬虫,获取小说目录、通过目录获取小说正文即可。二、使用步骤1.引入库代码如下(示例):import requests,sysfrom bs4 import BeautifulSoup2.读取页面代码如下(示例):targe
2021-01-24 14:35:43 7302 7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人