Python3-urllib库--网页抓取

最新推荐文章于 2022-03-22 21:01:55 发布

Arthur54271

最新推荐文章于 2022-03-22 21:01:55 发布

阅读量210

点赞数

分类专栏：爬虫网页抓取文章标签：网页抓取 urllib

本文链接：https://blog.csdn.net/zbrj12345/article/details/79874246

版权

爬虫同时被 2 个专栏收录

40 篇文章 0 订阅

订阅专栏

网页抓取

10 篇文章 0 订阅

订阅专栏

#urllib库的基本使用
'''
1、网页抓取
就是把URL地址中指定的网络资源从网络流中读取出来，保存到本地。
python2:urllib2
python3:urllib.request
'''

#1、引入模块
from urllib import request

#2、操作
#(1)定义目标url
base_url="http://www.baidu.com"

#(2)发起请求（GET）--向指定的url发送请求，并返回服务器响应的类文件对象
response=request.urlopen(base_url)
# print(response)#<http.client.HTTPResponse object at 0x104b62630>

#(3)获取内容
html=response.read()
# print(html)
#(4)转码
html=html.decode('utf-8')
# print(html)

#(5)保存内容
with open('www.baidu.com','w',encoding='utf-8') as f:
    f.write(html)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Arthur54271

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python3-urllib库--网页抓取

#urllib库的基本使用'''1、网页抓取就是把URL地址中指定的网络资源从网络流中读取出来，保存到本地。python2:urllib2python3:urllib.request'''#1、引入模块from urllib import request#2、操作#(1)定义目标urlbase_url="http://www.baidu.com"#(2)发起请求（GE...
复制链接

扫一扫