闲暇时间写了一个基于nodejs的爬虫工具,可以对视频网址等站点进行爬取数据
示例站点为dilidili动漫网
http、cheerio用于获取网站Dom数据
exceljs用于生成excel文件
Code:[https://github.com/cmyh100/dilidiliSpider]
使用方法
- 可以在src/index.js文件修改相关初始化参数(例如调整endTime: 2019-01)
- 结果保存于excel文件夹中
运行
npm i
npm start
备注
详情请参考github代码
excel多个文件合并可以看这里[https://blog.csdn.net/cmyh100/article/details/89020125]
小伙伴们走过路过,记得在GitHub上帮忙点个Star,谢谢了哈 (。・ω・。)ノ♡~
GitHub:[https://github.com/cmyh100]