![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 57
liucheng_zimozigreat
这个作者很懒,什么都没留下…
展开
-
莫烦爬虫学习记录
最初我会经常看一下自己的CSDN博客的总访问量、排名以及一些文章的访问量(看着这些量与日俱增心里很满足,哈哈),后来想学习一下爬虫,正好可以用来记录自己的CSDN博客的信息。在Google上第一条推荐教程是莫烦,之前在网易云上也跟着莫烦学了一下matplotlib,觉得蛮不错,于是就跟着莫烦来学习,B站上有视频,GitHub地址。正则表达式很重要,查阅参看小抄,另附需要转义的字符以及 使用Pyt...原创 2018-12-27 15:35:06 · 458 阅读 · 0 评论 -
爬取多页信息——爬取自己CSDN博客
知识传送门:正则表达式 要想每天定时启动程序请看这篇文章 在学完莫烦B站的爬虫视频的3.3节之后,我完成了这个项目,感觉收获还是不小的。 体会是自己练手感觉进步挺快,能做出一个小项目给了我一些自信心,中间几个棘手的问题: 1如何获取下一页:分析我的主页的HTML,发现有一个总的文章数、有pagesize(每页最多显示几篇文章),有此两值就可以得到总的页数。再发现每一页的url是这样的htt...原创 2018-12-29 17:17:39 · 1778 阅读 · 0 评论