python语言，pycharm程序中 requests库的简单使用

最新推荐文章于 2024-06-24 17:04:56 发布

学无止境-程序猿

最新推荐文章于 2024-06-24 17:04:56 发布

阅读量2.3k

点赞数 1

分类专栏： Python的常见库使用 Python的爬虫使用案例一只网络上的虫（爬虫实例）文章标签： requests库

本文链接：https://blog.csdn.net/Programmer_huangtao/article/details/80334220

版权

Python的常见库使用同时被 3 个专栏收录

40 篇文章 0 订阅

订阅专栏

Python的爬虫使用案例

34 篇文章 0 订阅

订阅专栏

一只网络上的虫（爬虫实例）

31 篇文章 1 订阅

订阅专栏

请求作用是请求网站获取网页数据的，所以作为一个预备的爬虫程序，要明白请求的作用，请求作用的，可以理解为我上你家串门，先问你有人没一个意思。

import requests                      #加入requests包
headers = {
    'User-Agent': 'Mozilla / 5.0(X11;Linux x86_64) AppleWebKit / 537.36(KHTML, like Gecko) Chrome / 66.0.3359.170 Safari / 537.36'
}                                    #插入请求头，这个是可有可没有，请求头找法一个网页按F12，点击网络或者Network,点击F5，然后随便选一个控制台中的链接点击，界面的右下角请求头就出现了。
res=requests.get('http://bj.ganji.com/',headers=headers)

print(res)
print(res.text)

请求库用法，执行的话应该是有赶集网址的，如果输出的是<Response [200]>，那就是没有问题的，如果输出的是404，那就是请求网站失败，说明你刚刚的爬虫爬区过于密集，引起引擎反爬了，禁止请求。

注意：

 'User-Agent': 'Mozilla / 5.0(X11;Linux x86_64) AppleWebKit / 537.36(KHTML, like Gecko) Chrome / 66.0.3359.170 Safari / 537.36'

是请求头，就是爬虫作为一个虚假的浏览器，模拟访问，以便于更好的抓取数据。

学无止境-程序猿

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录