3.urlretrieve函数、urlencode函数和parse_qs函数--爬虫

最新推荐文章于 2024-05-08 14:50:18 发布

若雨溪

最新推荐文章于 2024-05-08 14:50:18 发布

阅读量230

点赞数 1

分类专栏：个人学习爬虫预备知识

个人学习同时被 2 个专栏收录

24 篇文章 0 订阅

订阅专栏

爬虫预备知识

6 篇文章 0 订阅

订阅专栏

urlretrieve函数：
这个函数可以方便的将网页上的一个文件保存到本地。以下代码可以非常方便的将百度的首页下载到本地。

from urllib import request
request.urlretrieve('http://www.baidu.com/','baidu.html')

上面把生成的baidu.html保存在本地。

urlencode函数：
用浏览器发送请求的时候，如果url中包含了中文或者其他特殊字符，那么浏览器会自动给我们进行编码。而如果使用代码发送请求，那么就必须手动的进行编码，这时就应该使用urlencode函数来实现。urlcode可以把字典数据

from urllib import parse
params = ('name':'张三',"age":18,'greet':'hello word')
result  = parse.urlencode(params)
print(result)

eg.url里面不能包含英文，如果想访问 http://www.baidu.com/s?wd刘德华则应该对刘德华进行编码。

url = 'http://www.baidu.com/s'
params = {"wd":刘德华}
qs = parse.urlencode(params)
print(qs)
url = url + "?" + qs   //拼接
resp = request.urlopen(url)
print(resp.read())

parse_qs函数：
可以将经过编码后的url参数进行解码，示例如下：

from urllib import parse
qs = "name=%这里是经过编码后的字符"

eg.

params = ('name':'张三',"age":18,'greet':'hello word')
qs = parse.urlencode(params)
print(qs)
result = parse.parse_qs(qs)
print(result)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

若雨溪

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python爬虫①-----urllib库（基础用法）

钉子

10-23

196

urllib库 urllib库介绍它是 Python 内置的HTTP请求库，也就是说我们不需要额外安装即可使用，它包含四个模块(主要对前三个模块进行学习)： request : 它是最基本的 HTTP 请求模块，我们可以用它来模拟发送一请求，就像在浏览器里输入网址然后敲击回车一样，只需要给库方法传入 URL 还有额外的参数，就可以模拟实现这个过程了。 error : 异常处理模块，如果出现请...

数据爬虫（二）：python爬虫中urllib库详解,parse和request使用方法

Weiker的博客

02-02

8427

一、urllib.request 请求模块： urllib.request 模块提供了最基本的构造 HTTP （或其他协议如 FTP）请求的方法，利用它可以模拟浏览器的一个请求发起过程。利用不同的协议去获取 URL 信息。它的某些接口能够处理基础认证（ Basic Authenticaton）、redirections （HTTP 重定向)、 Cookies (浏览器 Cookies）等情况

参与评论您还未登录，请先登录后发表或查看评论

parse_qs函数---爬虫学习

python_Allen的博客

06-24

1307

parse_qs函数：可以将经过编码后的url参数进行解码。示例代码如下： from urllib import parse qs = “name=%E7%88%AC%E8%99%AB%E5%9F%BA%E7%A1%80&greet=hello+world&age=100” print(parse.parse_qs(qs))

Python：urllib解析查询参数parse_qsl、parse_qs

彭世瑜的博客

03-04

3970

from urllib.parse import parse_qsl, parse_qs q = 'name=Tom&name=Jack&age=13&school=&home' print(parse_qsl(q)) # [('name', 'Tom'), ('name', 'Jack'), ('age', '13')] print(parse_qs(q)) # {'name': ['Tom', 'Jack'], 'age': ['13']}

爬虫-urlencode与parse_qs函数

pyhui的技术博客

02-22

1914

urlencode 》功能将URL进行编码》用法 from urllib import parse qs = parse.urlencode(字典) # qs就是编码后的查询结果例子》发起请求时路径有中文，会报错》解决办法 parse_qs 》功能把编码后的内容进行解码》用法 from urllib import parse res = parse.parse_qs(...

利有Python库urllib.parse的成员函数parse_qs()解析URL 中的查询字符串

昊虹AI笔记

03-30

1023

利有Python库urllib.parse的成员函数parse_qs()解析URL 中的查询字符串

【爬虫】使用parse_qs函数来将查询字符串转换成字典

最新发布

weixin_43941438的博客

05-08

566

函数将查询字符串转换为一个元组列表，每个元组包含一个键和一个值列表。然后，我们使用列表推导式和一个字典推导式来创建一个新字典，其中键是原始键，值是解码后的值。执行这段代码，将得到一个字典，其中键是查询字符串中的参数名，值是参数值列表。（到这，就可以直接发请求，一般不会出问题。会将所有值都视为列表，即使它们只出现一次，如果需要单个值而不是列表，可能需要进一步处理字典。如果需要解码参数值，可以使用。来获取第一个元素，即实际的值。函数，然后手动解码每个值，或者使用。返回的值是一个列表，我们使用。

爬虫(2)urllib和parse库的介绍和常用函数介绍和使用

小白的程序猿

04-11

886

urllib库含有的网络请求的使用,以及怎么爬取网站上的图片到本地,对url地址的拆分这里也有,总之内容多多.....

python爬虫库函数大全-Python爬虫学习:一些库

weixin_39901439的博客

11-11

808

urllib库urlopen函数：在Python3的urllib库中，所有和网络请求相关的方法，都被集到urllib.request模块下面了，以先来看下urlopen函数基本的使用：from urllib importrequestresp= request.urlopen("http://www.baidu.com")print(resp.read())实际上，使用浏览器访...

Python爬虫常用库、模块、类、函数积累（更新ing）

weixin_45531423的博客

11-22

1130

urllib库 Python中的自带库，用来模拟HTTP发送请求 requests库第三方库，使用前先进行安装。 requests和urllib功能类似，用来模拟HTTP发送请求。requests是对urllib的再次封装，requests可以直接构建常用的get和post请求并发起，urllib一般要先构建get或者post请求，然后再发起请求。 request库的7个主要方法：方法...

python 分析http查询字符串 urlparse.parse_qs

Nicholas的专栏

09-27

6318

如何把get请求的参数转成字典 (Map) 1 2 urlparse.parse_qs(params) //str 需要转成字典的请求参数 //{'phone': ['075988888888'], 'id': ['10'], 'name': ['\xe4\xb8\xad\xe6\x96\x87']}

【Python】URL编码(urlencode)和URL解码(parse_qs)

Alan的博客

04-10

4619

提要:编码用urlencode()函数解码用（parse_qs）图片: 代码: #encoding: utf-8 from urllib import request from urllib import parse keyword = {"wd":"庄宿正"} encode = parse.urlencode(keyword) print(encode) print(...

python中parse.parseqs是干嘛的_用Python URL Parse Parse qs解析URL

weixin_42378973的博客

02-09

1099

这在Python2.7中有效，但在3.5中无效我正在尝试分割一个url的参数，然后用一个新值(md5散列)更改其中一个参数。URL就这样崩溃了ParseResult(scheme='http', netloc='example.com', path='/dynamic', params='', query='t=MD5-YOUR-OAUTH-TOKEN&p=11111111', fragm...

python url编码解码_Python urllib模块的URL编码解码功能

weixin_39866087的博客

11-22

155

前面介绍了 urllib 模块，以及它常用的 urlopen() 和 urlretrieve()函数的使用介绍。当然 urllib 还有一些其它很有用的辅助方法，比如对 url 进行编码、解码等等。接下来我们再大概介绍一下。我们知道，url 中是不能出现一些特殊的符号的，有些符号有特殊的用途。比如以 get 方式提交数据的时候，会在 url 中添加 key=value 这样的字符串，所以在 val...

python爬虫开发 urlparse、parse_qs、urlencode、quote、unquote、urljoin 用法总结

qq_40734108的博客

10-11

751

这个模块在爬虫开发过程中使用地频率非常高，这里总结了一些常用用法。

parse_qs方法和urlencode方法的区别

小颜颜6035的博客

08-31

497

1.parse_qs方法： from urllib import request,parse test = "ie=utf-8&wd=%E8%8B%8D%E8%80%81%E5%B8%88" print(parse.parse_qs(test)) #{'ie': ['utf-8'], 'wd': ['苍老师']} #将 url编码字符串转成字典 2.urlencode方法： from urllib import request,parse params = { 'ie':'utf-

qs的使用-qs.parse解析的详细用法

qq_42186138的博客

05-24

6134

安装 npm install qs 引入 import qs from ‘qs’ qs.parse 将字符串解析成对象的形式，注意：如果要解析url的参数，则需要去掉第一位的 ‘？’ 实例：现在百度中搜索 nab ，可以得到链接 ‘https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&t...

Qs.stringify()和Qs.parse()的用法和区别

sweet_note的博客

04-23

3651

转载地址：https://blog.csdn.net/suwu150/article/details/78333452 qs是一个npm仓库所管理的包,可通过npm install qs命令进行安装. 1. qs.parse()将URL解析成对象的形式const Qs = require('qs'); let url = 'method=query_sql_datas

urllib.request.urlretrieve

07-28

urllib.request.urlretrieve 是 Python 标准库中的一个函数，用于下载文件。它的作用是从指定的 URL 中下载文件，并将其保存到本地。使用 urllib.request.urlretrieve 函数，你可以通过以下方式下载文件： ```...