python模块中urllib和requests发送请求的区别

此次实践中获取网页使用的代码

urllib:

import urllib.request



url=['http://wz.lanzh.95306.cn/mainPageNoticeList.do?method=init&id=2000001&cur=1']

#通常我们爬取网页,在构造http请求的时候,都需要加上一些额外信息,什么Useragent,cookie等之类的信息,或者添加代理服务器。往往这些都是一些必要的反爬机制

headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36
'
    'Host':'httpbin.org'
}

#response对象是先创建httprequest对象

req=urllib.request.Request(url=url,headers=headers)

#装载到reques.urlopen里完成http请求,urlopen()方法返回的是一个http.client.HTTPResponse对象,需要通过read()方法做进一步的处理

rsp=urllib.request.urlopen(req)

#返回的是httpresponse对象,实际上是html属性,使用.read().decode()解码后转化成了str字符串类型,也可以看到decode解码后中文字符能够显示出来

html=rsp.read().decode('utf-8','ignore')

 

requests:

import requests



url = "https://www.iqiyi.com/"

#requests可以直接构造get,post请求并发起,而urllib.request只能先构造get,post请求,再发起。

header = {"user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}

#requests库调用是requests.get方法传入url和参数,返回的对象是Response对象

get_response = requests.get(url,headers=header,params=None)

#构造POST请求

post_response=requests.post(url,headers=headers,data=None,json=None)

#打印出来是显示响应状态码

print(post_response)

#打印结果:<Response [405]>

#通过.text 方法可以返回是unicode 型的数据,一般是在网页的header中定义的编码形式

print(get_response.text)

#打印结果:网页源码内容,是str数据类型

print(get_response.content)

#打印结果:b'<!doctype html>\n<html data-n-head-ssr>\n  <head >\n    <title>\xe7\x8.....即网页的Bytes类型,需要进行解码。作用和get_response.text类似

print(get_response.json)

#打印结果:<bound method Response.json of <Response [200]>> 就是json数据




参考博客:

https://blog.csdn.net/weixin_42213622/article/details/105852794

https://blog.csdn.net/qq_38783948/article/details/88239109

https://blog.csdn.net/ytraister/article/details/106376388

原理内容都是一样的,唯有练习和尝试才能记忆深刻!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Pythonurllibrequests是两个常用的网络请求库。urllibPython标准库模块,提供了一些用于进行网络请求的函数和类,使用简单但功能相对较少。而requests是一个第三方库,功能更丰富,提供了更方便的API来发送HTTP请求和处理响应。 在使用urllib进行GET请求时,可以使用urlopen方法来发送请求并获取响应,通过调用read方法来读取响应数据,然后使用decode方法进行解码。以下是一个示例: import urllib.request response = urllib.request.urlopen('http://www.baidu.com') print(response.read().decode()) 而对于POST请求urllib并没有单独提供相应的函数,而是通过构建Request对象来传递data参数来实现。具体的示例代码如下: import urllib.parse import urllib.request url = 'http://www.someserver.com/cgi-bin/register.cgi' values = {'name': 'Michael Foord', 'location': 'Northampton', 'language': 'Python'} data = urllib.parse.urlencode(values) data = data.encode('ascii') req = urllib.request.Request(url, data) with urllib.request.urlopen(req) as response: the_page = response.read() 另外,requests库提供了更加方便的API来发送GET和POST请求,并处理HTTP响应。以下是一个使用requests库的示例代码: import requests resp = requests.get('http://www.baidu.com') print(resp.text) 可以看到,requests的使用更加简洁明了,通过调用get方法来发送GET请求并获取响应,然后通过text属性来获取响应内容。 综上所述,urllibrequests都是常用的Python网络请求库,根据需求选择适合的库来进行网络请求操作。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python 网络请求模块 urllibrequests](https://blog.csdn.net/aifeier1982/article/details/101950448)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值