![](https://img-blog.csdnimg.cn/20190911093137895.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
爬虫
文章平均质量分 92
Chengjiayi2
这个作者很懒,什么都没留下…
展开
-
[爬虫练习]:爬取起点中文网的小说排行并存入excel表格中
使用的python库1.request库,用于向服务器发起请求信息。2.lxml库,用于解析服务器返回的HTML文件。3.time库,设置爬取时间差,防止短时间内多次页面请求而被限制访问。4.xwlt库,用于将数据存入excel表格之中爬取思路1.爬取页面的网址为https://www.qidian.com/all?page=1,经过手动浏览可以发现页面之间page的值不一样,由此可以...原创 2018-10-24 22:10:51 · 4176 阅读 · 1 评论 -
[爬虫练习]:在豆瓣电影的详情页爬取排名前250名的电影信息,存储在图形数据库Neo4j中
豆瓣网站的电影数据相对比较好获取,也是很多人学习爬虫时的练手目标,我以前刚刚学习爬虫时也是使用豆瓣和猫眼练习过,对于信息的可靠性来说,豆瓣上的评分更可靠一些。以前爬取电影的信息都是使用的豆瓣的电影排行页面,这个相对简单,且包含了基本想要的信息,这次爬虫练习希望爬取豆瓣电影排行top250的详情页,并将这些信息构建为类似知识图谱的(节点,边,节点)的结构1.爬取思路首先通过电影排名页面获得所...原创 2019-09-11 10:50:22 · 3250 阅读 · 2 评论