Python Spider
贵有恒,何必三更起五更睡;最无益,只怕一日暴十寒。
Python3爬虫实战:实战源码+博客讲解
学习交流群【328127489】
声明
代码、教程仅限于学习交流,请勿用于任何商业用途!
文章首发声明
文章在自己的个人网站首发,其他平台文章均属转发,如想获得最新更新进展,欢迎关注我的个人网站:http://cuijiahua.com/
目录
爬虫小工具
downloader.py:文件下载小助手
一个可以用于下载图片、视频、文件的小工具,有下载进度显示功能。稍加修改即可添加到自己的爬虫中。
动态示意图:
爬虫实战
biqukan.py:《笔趣看》盗版小说网站,爬取小说工具
第三方依赖库安装: pip3 install beautifulsoup4
使用方法: python biqukan.py
baiduwenku.py: 百度文库word文章爬取
代码不完善,没有进行打包,不具通用性,纯属娱乐。
carton: 使用Scrapy爬取《火影忍者》漫画
代码可以爬取整个《火影忍者》漫画所有章节的内容,保存到本地。更改地址,可以爬取其他漫画。保存地址可以在settings.py中修改。
financical.py: 财务报表下载小助手
爬取的数据存入数据库会吗?《跟股神巴菲特学习炒股之财务报表入库(M