github地址:https://github.com/Jack-Cherish/python-spider#%E5%85%B6%E5%AE%83
因为一些众所周知的原因,github的下载速度慢的让人抓狂(几k/s的速度还能下载失败,,,),所以我为了方便大家已经下载打包整理好了,有需要的同学欢迎评论区留言。
笔趣看小说下载
biqukan.py:《笔趣看》盗版小说网站,爬取小说工具
百度文库免费文章下载助手_rev1
baiduwenku.py: 百度文库word文章爬取
百度文库免费文章下载助手_rev2
baiduwenku.py: 百度文库word文章爬取
《帅啊》网帅哥图片下载
shuaia.py: 爬取《帅啊》网,帅哥图片
构建代理IP池
daili.py: 构建代理IP池
《火影忍者》漫画下载
carton: 使用Scrapy爬取《火影忍者》漫画
代码可以爬取整个《火影忍者》漫画所有章节的内容,保存到本地。更改地址,可以爬取其他漫画。保存地址可以在settings.py中修改。
财务报表下载小助手
financical.py: 财务报表下载小助手
爬取的数据存入数据库会吗?《跟股神巴菲特学习炒股之财务报表入库(MySQL)》也许能给你一些思路。
一小时入门网络爬虫
one_hour_spider:一小时入门Python3网络爬虫。
本次实战内容有&