爬虫系列笔记将汉字转化为%xx并爬取不同人物？信息

最新推荐文章于 2022-12-28 16:06:17 发布

想offer的第n天

最新推荐文章于 2022-12-28 16:06:17 发布

阅读量217

点赞数

分类专栏： python之爬虫文章标签：爬虫 python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/h91er/article/details/127328602

版权

python之爬虫专栏收录该内容

13 篇文章 1 订阅

订阅专栏

将汉字转化为%xx

import urllib.parse
string='哈哈哈'
zh=urllib.parse.quote(string)
print(zh)
zh1=urllib.parse.unquote(zh)
print(zh1)

在这里插入图片描述

爬取不同人物信息

在这里插入图片描述

通过观察上面的url发现wd后面跟的为所需要的参数，再往后的信息为其他用处不大的信息，在通过观察请求网址发现发送的网址中 中文参数被转化成了%xx格式，所以我们可以将所要查找的参数转化为%xx格式进行查询想要的信息。

import urllib.request
import urllib.parse

#将汉字转化为%xx 的形式
str=input('请输入你想查找的人物？信息：')
name=urllib.parse.quote(str)

url='https://www.baidu.com/s?wd='

url=url+name

headers={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 Safari/537.36'
}

request=urllib.request.Request(url=url,headers=headers)
response=urllib.request.urlopen(request)
content=response.read().decode('utf-8')
with open('我不是小黑子.html','w',encoding='utf-8')as f:
    f.write(content)

该网页的请求方法为get，参数在url中，还有一种请求方式为post二者差别见另一篇文章《爬虫post请求和get请求格式总结》
在这里插入图片描述

想offer的第n天

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫系列笔记将汉字转化为%xx并爬取不同人物？信息

爬虫系列笔记将汉字转化为%xx并爬取不同人物？信息
复制链接

扫一扫

专栏目录

想offer的第n天 CSDN认证博客专家 CSDN认证企业博客

码龄4年

39: 原创

55万+: 周排名

160万+: 总排名

2万+: 访问

: 等级

413: 积分

8: 粉丝

11: 获赞

6: 评论

49: 收藏

私信

关注

热门文章

分类专栏

numpy 1篇
Matplotlib代码笔记 4篇
python之爬虫 13篇
大数据 1篇
python 3篇
编译原理 3篇
笔记 1篇
算法 1篇
题解 8篇
C++自学 1篇

最新评论

爬虫系列笔记九BeautifulSoup
m0_68470600: 谢谢！
爬虫系列笔记九BeautifulSoup
想offer的第n天: with open('caidan.txt','w',encoding='utf-8')as f: for i in name_list: f.write(i.string+'\n') 可以这样写
爬虫系列笔记九BeautifulSoup
m0_68470600: 请问最后怎么讲爬取到的菜单数据保存为txt到本地呀
爬虫post请求和get请求格式总结
想offer的第n天: 问题解决了xdm，主要是因为请求头中'Accept-Encoding': 'gzip, deflate, br',里面有br，这个的意思是向服务器端发送支持的压缩格式，但是我这边并不支持br压缩，所以对于接收到的br压缩的问件解码就会出现错误。
python库中方法调用
不吃西红柿丶: 笔落惊风雨，诗成泣鬼神！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。