【爬虫】01 urllib 爬取网页

import urllib.request

response = urllib.request.urlopen('https://www.baidu.com/')

data = response.readlines()
print(data)

# 返回当前环境有关信息
print(response.info())

# 返回状态码 200成功处理了请求
print(response.getcode())

# 返回当前正在爬取的 url 地址
print(response.geturl())

# 解码
url = r'https://www.baidu.com/s?wd=200%E4%BB%A3%E8%A1%A8%E4%BB%80%E4%B9%88&rsv_spt=1&rsv_iqid=0x95ea389a0003eb1d&issp' \
      '=1&f=8&rsv_bp=1&rsv_idx=2&ie=utf-8&tn=baiduhome_pg&rsv_enter=1&rsv_dl=tb&rsv_sug3=21&rsv_sug1=28&rsv_sug7=101' \
      '&rsv_sug2=0&inputT=9758&rsv_sug4=10156 '
newUrl = urllib.request.unquote(url)
print(newUrl)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值