爬虫(初级)

最新推荐文章于 2022-07-11 07:35:00 发布

Phtomhive

最新推荐文章于 2022-07-11 07:35:00 发布

阅读量269

点赞数

分类专栏： python #爬虫文章标签：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37461330/article/details/103920182

版权

python 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

crawler基本原理：Request(请求)：每一个展示在用户面前的网页都必须经过这一步，也就是向服务其发送请求；

Response(响应)：服务器在接收到用户的请求后，会验证请求的有效性，然后向用户(客户端)发送响应的内容，客户端接收服务器响应的内容，将内容展示出来，就是我们所熟悉的网页请求。

网页请求的方式：GET、POST

POST请求数据必构建请求头才可以！！！

第一步：打开一个网页，比如中国旅游网首页(http://www.cntour.cn/)，按快捷键(Ctrl+U)打开源码页面，如下图所示：

第二步：使用GET方式抓取数据

第二步(other)：使用POST方式抓取数据

第三步:(继第二步(other)后)：构建请求头：

注意：这个网站有反爬机制，如果出现了'errorCode：50'，说明触发了反爬机制。此处可以把url网址里面的_o删掉！！！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫(初级)

crawler基本原理：Request(请求)：每一个展示在用户面前的网页都必须经过这一步，也就是向服务其发送请求； Response(响应)：服务器在接收到用户的请求后，会验证请求的有效性，然后向用户(客户端)发送响应的内 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。