![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
csv
weixin_36605200
这个作者很懒,什么都没留下…
展开
-
python爬虫实战---豆瓣电影top250的电影信息抓取
本文主要抓取豆瓣电影top250榜单里面的电影数据,提取的数据包括电影名称、电影的链接、电影的星级、电影引言、电影的评论 人数等。导入包from bs4 import BeautifulSoup as bs---进行网页解析import requests---用于网页请求import time---用于延长时间,防止过于快速抓取数据,封ipimport re---正则表达式使用...原创 2018-09-01 23:10:44 · 5200 阅读 · 2 评论 -
python爬虫实战---网易云音乐评论抓取
本文主要是提取网易云音乐中歌曲的评论时间、评论者昵称、评论内容,并把数据写进csv文件里面,读取文件里面存储的评论内容,根据指定的背景图制作词云,抓取目标https://music.163.com/#/song?id=1299557768,2018年八月最热新歌TOP50中的Animal歌曲。引言网易云大厂一般都对自己的数据做了很好的加密,一般直接爬取都爬取不到数据,这也是爬取当中一个很头...原创 2018-09-02 20:17:14 · 16554 阅读 · 6 评论 -
python爬虫----猫眼电影:最受期待榜
看一下猫眼的最受期待榜,了解大家都在期待什么样的电影,所以抓取数据来汇总。模块requests--->用于请求 re---->正则表达式的使用 os---->用于处理目录 csv---->用于csv文件的读写 bs4---->获取网页响应的节点信息 pandas--->读取csv文件 pyecharts import Line---->...原创 2018-12-09 18:42:41 · 1005 阅读 · 0 评论