爬虫入门简例

captainNYS

于 2018-12-10 14:50:44 发布

阅读量374

点赞数

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/captainnys/article/details/84939682

版权

爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本文分享了基于Python的网络爬虫实战经验，涵盖图书、音乐、小说、图片、微博等多种数据源的爬取技巧，利用BeautifulSoup、XPath、Selenium等工具解析网页，同时介绍了数据清洗、存储至Excel及数据库的方法。

摘要由CSDN通过智能技术生成

根据机械工业出版社出版的《从零开始学Python网络爬虫》指导，实现其提供的简例。
修改了一些小问题，代码见GitHub。

1、KuGou.py：爬取酷狗top500，beautifulsoup库解析

2、DouPo.py：使用正则表达式爬取小说，并做一定数据清洗

3、DouBanTOP250booksExcel.py：爬取豆瓣top250图书存储excel表

4、QiDian.py：Xpath爬取小说信息

5、PEXELS.py：爬取图片并保存

6、API_BaiDuMap.py：调用百度api，解析json数据，返回地点经纬度

7、QiuShiDiTu.py：调用api，爬取糗事百科网用户地址信息

8、DouBanTOP250booksMySQL.py：爬取豆瓣top250图书存储mysql数据库

9、JianShu_MultiProcess.py：多进程爬取简书存储mysql

10、Ajax_JianShu.py：通过抓包分析出动态加载的简书页面，构造爬虫

11、WeiBo.py：使用cookie信息模拟登陆，爬取微博好友圈

12、Selenium_DouBan.py：使用selenium登陆豆瓣

13、Selenium_JingDong.py：selenium爬取京东笔记本电脑列表存储mysql

小白，错误难免，望指正。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

captainNYS CSDN认证博客专家 CSDN认证企业博客

码龄7年

38: 原创

14万+: 周排名

189万+: 总排名

4万+: 访问

: 等级

844: 积分

30: 粉丝

30: 获赞

9: 评论

35: 收藏

私信

关注

分类专栏

java 9篇
mysql 19篇
前端 4篇
GitHub 3篇
爬虫 3篇
算法 1篇
计算机网络 4篇
JVM 7篇
数据库
DL 1篇

最新评论

吴恩达深度学习1-4（Build your neural network step by step） L_model_backword 函数
德林恩宝: 没什么意义，但按照计算方式，也算出来了
吴恩达深度学习1-4（Build your neural network step by step） L_model_backword 函数
Fake_Killer: 十分感谢！也怪我学的粗心大意，哪一层谁该乘谁写着写着就忘了，纠结了好久看到你的答案才茅塞顿开
聚集索引，非聚集索引和覆盖索引（多字段索引or复合索引）
CWY_JAVA: 666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666
吴恩达深度学习1-4（Build your neural network step by step） L_model_backword 函数
qq_42138534: dA0 有什么意义嘛
数据库三大范式通俗讲解
Tracy-努力ing: 感谢博主的分享

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。