爬虫
文章平均质量分 65
TQ2
这个作者很懒,什么都没留下…
展开
-
多协程和队列,爬取时光网电视剧TOP100的数据(剧名、导演、主演和简介)
目录说明Codeget_movie_id.pyget_movie_url.pyget_movie_info.pyinfo2csv.pymain.py说明首先查看电视剧网页结构,发现所有电视剧都在下面位置:从中我们并未发现电视剧的链接,于是我们打开几部电视剧发现网页url有没有什么规律。发现信息在下面文件里:打开它的Headers:url:http://front-gateway.mtime.com/library/movie/detail.api?tt=1617353592649&m原创 2021-04-02 17:02:33 · 3699 阅读 · 4 评论 -
Selenium模拟浏览器获取爬取QQ音乐歌词、评论等。
说明请使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(可以是任意歌手)最受欢迎的前5首歌曲的歌词、流派、歌曲发行时间、评论条数、评论时间、评论点赞次数、评论内容具体(每一首歌的评论>=500条)。如下图所示:歌词、流派、歌曲发行时间、评论条数保存在: music_info.csv文件中。评论时间、评论点赞次数、评论内容具体保存在: comments_info.csv文件中。统计每首歌的每个评论点赞次数保存在: series.csv文件中。请按照如下形式组织代码:原创 2021-04-01 20:58:24 · 2399 阅读 · 2 评论