7. CnkiSpider – 中国知网爬虫。
设置检索条件后,执行src/CnkiSpider.py抓取数据,抓取数据存储在/data目录下,每个数据文件的第一行为字段名称。
部分代码截图:
8. LianJiaSpider – 链家网爬虫。
爬取北京地区链家历年二手房成交记录。涵盖链家爬虫一文的全部代码,包括链家模拟登录代码。
部分代码截图:
9. scrapy_jingdong – 京东爬虫。
基于scrapy的京东网站爬虫,保存格式为csv。
部分代码截图:
10. QQ-Groups-Spider – QQ 群爬虫。
批量抓取 QQ 群信息,包括群名称、群号、群人数、群主、群简介等内容,最终生成 XLS(X) / CSV 结果文件。
部分代码截图: