Python爬虫的一些常用库(请求2)

最新推荐文章于 2024-09-05 10:28:02 发布

冷巷(✘_✘)

最新推荐文章于 2024-09-05 10:28:02 发布

阅读量627

点赞数 1

分类专栏： python 文章标签： python 爬虫 pycharm

本文链接：https://blog.csdn.net/m0_66060262/article/details/122732661

版权

python 专栏收录该内容

26 篇文章 3 订阅

订阅专栏

爬虫第一步就是请求了，请求模块一般是requests和urllib，而urllib现在很少人用了，但是也有人，下面我们试试安装和使用吧。

安装

简单的用法

import urllib.request
response = urllib.request.urlopen('http://www.baidu.com')
print(response.read().decode('utf-8'))

和requests的请求对比可以发现，网址头是http，如果换成https的话爬不出来内容

代理IP

import urllib.request
proxy_handler = urllib.request.ProxyHandler({
    'http':'http://127.0.0.1:9743',
    'https':'https://127.0.0.1:9743'
})
openner = urllib.request.build_opener(proxy_handler)
response = openner.open('http://httpbin.org/ip')
print(response.read().decode())

我没怎么学过urllib，知道的不多，而且也不常用urllib，所以就这样OK了

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

冷巷(✘_✘)

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Python爬虫的一些常用库(请求2)

爬虫第一步就是请求了，请求模块一般是requests和urllib，而urllib现在很少人用了，但是也有人，下面我们试试安装和使用吧。安装简单的用法import urllib.requestresponse = urllib.request.urlopen('http://www.baidu.com')print(response.read().decode('utf-8'))和requests的请求对比可以发现，网址头是http，如果换成https的话爬不出来内容
复制链接

扫一扫