使用urllib模块的百度实战演练

urllib.parse与urllib.request模块的综合运用

  1. **urllib.parse **加粗样式
  2. urllib.request.Request()
  3. urllib.request.urlopen()

从百度上爬取一个链接,并下载保存这个网页数据

import urllib.parse
import urllib.request
#构造一个url的不变部分
baseurl = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd='
content = input('请输入搜素内容')
#url 关键词部分
wd = {'wd':content}


content=urllib.parse.urlencode(wd)

#拼接Url
url = baseurl + content
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'}
r=urllib.request.Request(url,headers=headers)
res = urllib.request.urlopen(r)
html = res.read().decode("utf-8")
with open("海贼王.html",'w',encoding='utf-8') as f:
    f.write(html

其中,不难看出urllib.parse()有点类似重构Url 的作用。心得:原本不是很理解这个模块的作用,但在使用过中,对这个模块产生了一种豁然开朗的明悟,所以需要多加练习。欢迎大家的继续监督,小编在此谢过~~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值