网络爬虫学习（附链接）

最新推荐文章于 2024-08-15 12:11:47 发布

鲛人泪

最新推荐文章于 2024-08-15 12:11:47 发布

阅读量1k

点赞数 4

文章标签：爬虫学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43245971/article/details/136783263

版权

开发环境搭建：python安装、Anaconda安装

python详细安装教程 - 知乎 (zhihu.com)

Anaconda详细安装及使用教程（带图文） - 知乎 (zhihu.com)

Win10下Python环境：

http://www.cnblogs.com/zlslch/p/6984331.html

https://blog.csdn.net/LYJ_viviani/article/details/51763101

IDE:

https://blog.csdn.net/vola9527/article/details/75194874

https://www.cnblogs.com/zhaof/p/8126306.html

学习Robots协议，安装Requests库和BeautifulSoup库、学习使用scrapy框架创建爬虫程序

收集某论坛帖子

静态网页：GET、POST等方法访问Web网站

爬取某静态页面数据

解析数据：正则表达式与re模块、XPath、 Beautiful Soup库与CSS选取节点，JSONPath与jsonpath模块

正则表达式链接：爬虫入门到精通-网页的解析（正则） - 知乎

网络的解析：XPATH

https://zhuanlan.zhihu.com/p/25572729

http://www.w3school.com.cn/xpath/index.asp

XML: http://www.w3school.com.cn/xml/xml_intro.asp

爬虫框架：

https://blog.csdn.net/zuochao_2013/article/details/75655656

https://blog.csdn.net/Ivan_zgj/article/details/50992611

动态网页：JavaScript和Ajax技术，Selenium和WebDriver的安装与配置
文件读写与数据存储：MongoDB数据库、Redis数据库、CSV文件

爬取某动态网站的主体信息、价格、评论等

数据处理与分析计算: Python(NumPy, pandas, Matplotlib库的应用)
scrapy爬虫程序：Scrapy核心组件与CrawlSpider类、网站反爬虫;

提升爬取速度：多线程爬虫、分布式网络爬虫Scrapy-Redis

模拟浏览器与网站测试: 单元测试unittest、Selenium测试……

学习资料：

Python学习：

链接：

Python教程 - 廖雪峰的官方网站

Python网络爬虫与数据采集

链接：https://pan.baidu.com/s/16cYuiXaVATduAaF-b7_xLg 提取码：a5ns

2. Python网络爬虫与信息提取北京理工大学

链接：Python网络爬虫与信息提取北京理工大学：嵩天_哔哩哔哩_bilibili

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
网络爬虫学习（附链接）

一起学习，动手多练
复制链接

扫一扫

鲛人泪 CSDN认证博客专家 CSDN认证企业博客

码龄6年

2: 原创

165万+: 周排名

21万+: 总排名

2226: 访问

: 等级

46: 积分

18: 粉丝

15: 获赞

3: 评论

33: 收藏

私信

关注

热门文章

最新评论

密码学知识点梳理
CSDN-Ada助手: 恭喜你开始了博客创作，标题“密码学知识点梳理”听起来很有深度！希望你能继续分享更多关于密码学的知识点，可以结合实际案例或者最新研究成果进行深入分析，这样读者们会更加受益。加油！期待你的下一篇文章。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
网络爬虫学习（附链接）
CSDN-Ada助手: 很高兴看到您写了第二篇博客，标题“网络爬虫学习（附链接）”听起来非常有趣！摘要中的“一起学习，动手多练”也让人感到您对学习和实践的热情。继续保持创作的激情吧！另外，除了学习网络爬虫的基础知识和技能，您还可以尝试深入了解数据分析和处理的方法，以及如何利用爬虫工具获取更复杂的数据并进行相应的分析。希望您可以在这个领域有更深入的探索和学习，不断提升自己的能力！祝您创作顺利，加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
密码学知识点梳理
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/618243594。

最新文章

密码学知识点梳理

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。