python urllib.request_Python urllib request模块发送请求实现过程解析

1.Request()的参数

import urllib.request

request=urllib.request.Request("https://python.org")

response=urllib.request.urlopen(request)

print(response.read().decode("utf-8"))

通过构造这个数据结构,一方面可以我们可以将请求独立成一个对象,另一方面可以更加丰富和灵活地配置参数。

它的构造方法如下:

class.urllib.request.Request(url,data=None,headers={},origin_rep_host=None,unverifiable=False,method=None)

参数:

1.url必传参数

2.data,必须传bytes类型。如果是字典,先使用urllib.parse里的urlencode()

3.headers,是一个字典,请求头,直接构造或者用add_header()方法添加

4.origin_rep_host,请求方的名称或者ip地址

5.unverifiable,默认为false,表示这个请求是否无法验证。如果没有抓取的权限,此时值就是true。

6.method,用来指示请求使用的方法。

尝试传入多个参数构建请求:

from urllib import request,parse

url="http://httpbin.org/post"

headers={

"Url-Agent":"Mozilla/4.0(compatible;MSIE 5.5;Windows NT)",

"Host":"httpbin.org"

}#也可以使用add_header()方法添加headers:#req=request.Request(url=url,data=data,method="POST")#req.add_header("User-Agent","Mozilla/4.0(compatible;MSIE 5.5;Windows NT)")

dict={

"name":"Germey"

}

data=bytes(parse.urlencode(dict),encoding="utf-8")#用urlencode()将dict转换成bytes类型,传递给data

req=request.Request(url=url,data=data,headers=headers,method="POST")

response=request.urlopen(req)

print(response.read().decode("utf-8"))

运行结果:

5dc66074953afb927b033c844be99cb8.png

2.Handler与Opener

Handler:

它是各种处理器,几乎可以做到HTTP请求中的所有事情。

urllib.request模块里的BaseHandler类,它是所有其他Headler的父类,它提供了最基本的方法。

Opener:

例如urlopen()就是一个Opener,它是urllib为我们提供的。

它们的关系是:使用Handler来构建Opener。

3.用法

验证:

创建一个需要验证的网站,我这里使用的是IIS

ba57a1aad9ade94adbe71339d4b572d5.png

遇到的问题:

IIS怎样安装与配置-百度经验 (baidu.com)

IIS网站如何设置基本身份验证-百度经验 (baidu.com)

window10家庭版解决IIS中万维网服务的安全性中无Windows身份验证 - enjoryWeb - 博客园 (cnblogs.com)

代码:

from urllib.request import HTTPPasswordMgrWithDefaultRealm,HTTPBasicAuthHandler,build_opener

from urllib.error import URLError

username="username"#填上自己的用户名和密码

password="password"

url="http://localhost:5000/"

p=HTTPPasswordMgrWithDefaultRealm()

p.add_password(None,url,username,password)#添加用户名和密码,建立了一个处理验证的Handler

auth_handler=HTTPBasicAuthHandler(p)#基本认证

opener=build_opener(auth_handler)#利用Handler构建一个Opener

try:

result=opener.open(url)#打开链接

html=result.read().decode("utf-8")

print(html)#结果打印html源码内容

except URLError as e:

print(e.reason)

代理:

添加代理,在本地搭建一个代理,运行在9743端口上。

代码:

from urllib.request import ProxyHandler,build_opener

from urllib.error import URLError

proxy_handler=ProxyHandler({

"http":"http://127.0.0.1:9743",

"https":"https://127.0.0.1:9743"

})#构建一个Handler

opener=build_opener(proxy_handler)#构建一个Opener

try:

response=opener.open("https://www.baidu.com")

print(response.read().decode("utf-8"))

except URLError as e:

print(e.reason)

Cookies:

将网站的Cookies获取下来:

代码:

import http.cookiejar,urllib.request

cookie=http.cookiejar.CookieJar()#声明一个CookieJar对象

handler=urllib.request.HTTPCookieProcessor(cookie)#构建一个Handler

opener=urllib.request.build_opener(handler)#构建一个Opener

response=opener.open("http://www.baidu.com")

for item in cookie:

print(item.name+"="+item.value)

运行结果:

9ff0195aeef3cc1272688963ed97c3c9.png

将Cookie输出成文件格式:

代码:

import http.cookiejar,urllib.request

filename="cookies.txt"

cookie=http.cookiejar.MozillaCookieJar(filename)

#MozillaCookieJar()生成文件时用到,用来处理Cookie和文件相关的事件

#如果要保存LWP格式的Cookies文件,可以改为:

#cookie=http.cookiejar.LWPCookieJar(filename)

handler=urllib.request.HTTPCookieProcessor(cookie)

opener=urllib.request.build_opener(handler)

response=opener.open("http://www.baidu.com")

cookie.save(ignore_discard=True,ignore_expires=True)

运行结果:

# Netscape HTTP Cookie File

# http://curl.haxx.se/rfc/cookie_spec.html

# This is a generated file! Do not edit.

.baidu.com TRUE / FALSE 1638359640 BAIDUID 9BB1BA4FDD840EBD956A3D2EFB6BF883:FG=1

.baidu.com TRUE / FALSE 3754307287 BIDUPSID 9BB1BA4FDD840EBD25D00EE8183D1125

.baidu.com TRUE / FALSE H_PS_PSSID 1445_33119_33059_31660_33099_33101_26350_33199

.baidu.com TRUE / FALSE 3754307287 PSTM 1606823639

www.baidu.com FALSE / FALSE BDSVRTM 7

www.baidu.com FALSE / FALSE BD_HOME 1

LWP格式:

#LWP-Cookies-2.0

Set-Cookie3: BAIDUID="DDF5CB401A1543ED614CE42962D48099:FG=1"; path="/"; domain=".baidu.com"; path_spec; domain_dot; expires="2021-12-01 12:04:18Z"; comment=bd; version=0

Set-Cookie3: BIDUPSID=DDF5CB401A1543ED00860C3997C3282C; path="/"; domain=".baidu.com"; path_spec; domain_dot; expires="2088-12-19 15:18:25Z"; version=0

Set-Cookie3: H_PS_PSSID=1430_33058_31254_33098_33101_33199; path="/"; domain=".baidu.com"; path_spec; domain_dot; discard; version=0

Set-Cookie3: PSTM=1606824257; path="/"; domain=".baidu.com"; path_spec; domain_dot; expires="2088-12-19 15:18:25Z"; version=0

Set-Cookie3: BDSVRTM=0; path="/"; domain="www.baidu.com"; path_spec; discard; version=0

Set-Cookie3: BD_HOME=1; path="/"; domain="www.baidu.com"; path_spec; discard; version=0

以LWP格式的文件为示例,展示读取和利用的方法:

代码:

import http.cookiejar,urllib.request

cookie=http.cookiejar.LWPCookieJar()

#如果文件保存为Mozilla型浏览器格式,可以改为:

#cookie=http.cookiejar.MozillaCookieJar()

cookie.load("cookies.txt",ignore_discard=True,ignore_expires=True)

#调用load()方法来读取本地的Cookies文件,获取Cookies的内容

handler=urllib.request.HTTPCookieProcessor(cookie)

opener=urllib.request.build_opener(handler)

response=opener.open("http://www.baidu.com")

print(response.read().decode("utf-8"))

运行结果:输出网页源代码。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持云海天教程。

原文链接:https://www.cnblogs.com/Alone-haoran/p/14044861.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这段代码用于将存储库中每个解的位置映射到对应的网格索引。 1. 首先,获取存储库中适应度矩阵的行数,即解的数量,并保存在变量 `npar` 中。 2. 创建大小为 `(npar × 1)` 的零向量 `REP.grid_idx`,用于存储每个解所在的网格索引。 3. 创建大小为 `(npar × ndim)` 的零矩阵 `REP.grid_subidx`,用于存储每个解在每个维度上的子索引。 4. 使用两个嵌套的循环,对每个解进行处理。 - 外部循环 `n` 遍历解的索引,从1到 `npar`。 - 内部循环 `d` 遍历每个维度,从1到 `ndim`。 5. 在内部循环中,使用 `find` 函数找到每个解在当前维度上满足小于等于超立方体边界限制的第一个位置,并将结果减去1,保存在 `REP.grid_subidx(n,d)` 中。这样可以得到每个解在每个维度上的子索引。 6. 如果 `REP.grid_subidx(n,d)` 的值为0,将其设置为1。这是为了处理那些处于超立方体边界的解。 7. 构建一个字符串 `idnames`,用于构造 `sub2ind` 函数的输入参数。该字符串包含每个维度上的子索引,用逗号分隔。 8. 调用 `eval` 函数计算 `sub2ind` 函数的输入参数,并将结果赋值给 `REP.grid_idx(n)`,即当前解所在的网格索引。 这段代码的目的是将存储库中每个解的位置映射到对应的网格索引,并将结果存储在 `REP.grid_idx` 和 `REP.grid_subidx` 中。这样可以根据网格索引来查找和操作存储库中的解。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值