使用urllib模块的百度实战演练

最新推荐文章于 2024-08-03 19:27:22 发布

LJ_1_9_1_9_2_4

最新推荐文章于 2024-08-03 19:27:22 发布

阅读量179

点赞数

分类专栏：笔记文章标签： python

本文链接：https://blog.csdn.net/lj_1_9_1_9_2_4/article/details/107876172

版权

笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

urllib.parse与urllib.request模块的综合运用

**urllib.parse **加粗样式
urllib.request.Request()
urllib.request.urlopen()

从百度上爬取一个链接，并下载保存这个网页数据

import urllib.parse
import urllib.request
#构造一个url的不变部分
baseurl = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd='
content = input('请输入搜素内容')
#url 关键词部分
wd = {'wd':content}


content=urllib.parse.urlencode(wd)

#拼接Url
url = baseurl + content
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}
r=urllib.request.Request(url,headers=headers)
res = urllib.request.urlopen(r)
html = res.read().decode("utf-8")
with open("海贼王.html",'w',encoding='utf-8') as f:
    f.write(html

其中，不难看出urllib.parse()有点类似重构Url 的作用。心得：原本不是很理解这个模块的作用，但在使用过中，对这个模块产生了一种豁然开朗的明悟，所以需要多加练习。欢迎大家的继续监督，小编在此谢过~~

LJ_1_9_1_9_2_4

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用urllib模块的百度实战演练

urllib.parse与urllib.request模块的综合运用**urllib.parse **加粗样式urllib.request.Request()urllib.request.urlopen()从百度上爬取一个链接，并下载保存这个网页数据import urllib.parseimport urllib.request#构造一个url的不变部分baseurl = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&amp
复制链接

扫一扫