我的爬虫记
smile-yan
欢迎留言评论交流~~一定回复~~欢迎留言评论交流~~一定回复~~欢迎留言评论交流~~一定回复~~
展开
-
linux 定时任务 (python 爬虫统计博客数据)
linux 定时任务 (python 爬虫)1. 任务目标每天统计一下今日博客的各项数据,并以邮件的形式发送给自己。2. linux 定时任务 (python)一切复杂的任务都应该从最简单的开始,这位博主有一个很简单易懂的demo,请参考一下他的这篇 博客。在理解基本过程后,就可以开始定时运行python脚本了。首先在某目录下新建任务文件 crontest.cron,用于存在定时任务语句。相同新建 hello.py 文件,并且编辑这个文件写一句简单的 print('Hello World')原创 2020-10-27 16:29:12 · 11043 阅读 · 2 评论 -
30行代码统计自己 CSDN 博客相关数据
1. 编写目的爬虫本身是一个非常简单的事情,都是由于业务需要才变得越来越复杂的。为了方便广大开发者,也有很多简单好用的爬虫框架,但这里不使用那些已经实现了的专用框架,也不能起到任何商业化的目的,只是单纯地爬一下自己 csdn 博客数据。当然,为了更加好玩可以自行添加一些功能,比如说增加粉丝或者有评论时给自己发个邮件等等。当初还自己写了一些统计功能,但是现在 CSDN 已经提供了 “数据观星” 的功能,没事的时候可以逛逛看看自己的博客访客点赞评论数目(多么少)。2. 具体实现2.1 依赖pytho原创 2020-10-20 17:04:37 · 10923 阅读 · 0 评论 -
CSDN什么时候更新排名,爬虫项目告诉你
编写目的因为好奇心,所以写代码。到底csdn什么时候回更新自己的排名?不妨写一个爬虫软件,定时爬数据,查看什么时候发生了变化。详细过程可以使用java爬虫,但是java爬虫写多了没什么意思,玩一下node.js爬虫。首先给源码地址https://github.com/smile-yan/node-csdn晚上启动,一直到第二天起床后就可以看到效果如下:可以看出,csdn更新排名时间就是...原创 2019-08-21 17:45:27 · 11040 阅读 · 2 评论 -
node.js 爬虫的简单例子(查看CSDN访客,排名,分数)
1.编写目的一个简单的例子,使用node.js来爬虫,获得某个csdn博客博主的访客,排名,分数。2.具体过程下载安装node.js(此过程非常简答,不赘述)编写一个js文件。var http = require('https');http.get('https://blog.csdn.net/smileyan9',function(res){var data = '';res.o...原创 2019-08-17 00:38:01 · 11032 阅读 · 0 评论