Python3-urllib库--网页抓取

#urllib库的基本使用
'''
1、网页抓取
就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。
python2:urllib2
python3:urllib.request
'''

#1、引入模块
from urllib import request

#2、操作
#(1)定义目标url
base_url="http://www.baidu.com"

#(2)发起请求(GET)--向指定的url发送请求,并返回服务器响应的类文件对象
response=request.urlopen(base_url)
# print(response)#<http.client.HTTPResponse object at 0x104b62630>

#(3)获取内容
html=response.read()
# print(html)
#(4)转码
html=html.decode('utf-8')
# print(html)

#(5)保存内容
with open('www.baidu.com','w',encoding='utf-8') as f:
    f.write(html)
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值