如何入门Python爬虫？

yul364102

已于 2022-10-20 18:28:35 修改

阅读量159

点赞数

文章标签： python 爬虫开发语言 django pygame

于 2022-10-19 15:58:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yul364102/article/details/127409860

版权

最近发现了原来有许多人都在问爬虫是要怎么学的，所以呢，就感觉到，可能大家缺少一份爬虫教程。

所以准备整一个简简单单的入门小教程，虽然不是很精深，但是教大家爬取一个小页面的内容还是可以的。

首先呢，说一下学习的方法

第一，你需要有一个小目标，比如说我当时的小目标其实是爬取知乎的文章，不知道你的小目标是什么呢？

第二，最好有一定的基础，能明白大体的语法，别到时候连 import 和 from 都不明白。

第三，边学边做，这点很重要，因为有的东西就是这样，我眼睛看会了但是我的脑子并不会，而你边学边做的话，遇到问题可以回去看或者百度查，要不到时候会很难受的。

第四，学会利用 GitHub，这里面有许多关于 python 的优秀库，很适合大家使用。

话不多说，切入正题。

不过还是要说一句题外话，其实这个入门我写过一篇类似的，叫爬虫基础，欢迎大家阅读。

首先呢，库很推荐使用的是 requests_html 当然使用 requests 也可以，这两个应该是现在最流行的了吧。

安装也是老生常谈的内容了。

pip install requests

主要说一下 requests 吧，安装就是这么简简单单。然后我们直接 import requests 就可以把库导入了。具体的一些获取方法就不在这里详谈了，百度有很多，当然我推荐的是权威文档 —->Requests 快速上手

一般来说，这些文档都是很实用的，我以前比较爱看书，现在其实比较爱看文档了。

然后嘞，我们既然知道了这个库，也明白了要去学习该如何使用了，接下来要做什么呢？接下来需要学习一下 html，哈哈真的，不是在逗你哦，因为你爬取的毕竟是网页，而网页是通过 html+css+JavaScript 来写的，不需要你明白他怎么写，只需要懂得这是干啥的就行了。

之后学习一下 re 正则，这个对爬虫来说真的很实用，比如说我的那篇文章，爬取知乎盐选，就是利用正则抓取下一页的跳转链接的。正则其实入门的话没必要怎么学，只需要知道怎么抓取指定的值就好了，之后再慢慢学下去。

然后再接下来学习 scrapy，来进行更进一步的爬取，大体的思路也就是这些，上手其实是和容易的，并且爬一些简单的站也是非常容易地，但是真正要爬一些有东西的网站还是很难得，另外就是没事看看别人的代码，对自己有很大的帮助，别人写的狗屁不通，你就要学习一下如何写的不像他那样，别人写的精益求精，你就要学习一下如何写的这么好，别人好的思路你学习，别人查的方法你反思，不断学习，勇攀高峰！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何入门Python爬虫？

然后再接下来学习 scrapy，来进行更进一步的爬取，大体的思路也就是这些，上手其实是和容易的，并且爬一些简单的站也是非常容易地，但是真正要爬一些有东西的网站还是很难得，另外就是没事看看别人的代码，对自己有很大的帮助，别人写的狗屁不通，你就要学习一下如何写的不像他那样，别人写的精益求精，你就要学习一下如何写的这么好，别人好的思路你学习，别人查的方法你反思，不断学习，勇攀高峰！之后学习一下 re 正则，这个对爬虫来说真的很实用，比如说我的那篇文章，爬取知乎盐选，就是利用正则抓取下一页的跳转链接的。
复制链接

扫一扫

yul364102 CSDN认证博客专家 CSDN认证企业博客

码龄2年

82: 原创

111万+: 周排名

177万+: 总排名

4万+: 访问

: 等级

967: 积分

19: 粉丝

7: 获赞

4: 评论

47: 收藏

私信

关注

热门文章

最新评论

关于python爬虫中chromedriver的路径配置问题
m0_67119236: 有效，给你点赞了
Python 教程：日志功能与处理逻辑
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。相比 loguru 有10胜。 pip install nb_log 。
在 Python 中进步的 7 个必备 Python 技能
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。