Python爬虫——urllib的使用

最新推荐文章于 2023-07-15 14:51:02 发布

SmoMark

最新推荐文章于 2023-07-15 14:51:02 发布

阅读量350

点赞数

分类专栏： Python 文章标签： Python urllib 爬虫

本文链接：https://blog.csdn.net/m0_37770300/article/details/81266825

版权

Python 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Python爬虫——urllib的使用

本文使用的版本为Python3，使用的IDE为Pycharm

爬取百度首页

# 导入模块
from urllib import request

# 伪装成浏览器
headers=("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36")
opener=request.build_opener()
opener.addheaders=[headers]
request.install_opener(opener)

# 设置超时
file = request.urlopen("http://www.baidu.com", timeout=1)
# 读取全部数据
data = file.read()
# 读取第一行数据
dataline = file.readline()
# 写入文件
fhandle = open("D:/baidu.html", "wb")
fhandle.write(data)
fhandle.close()

print(dataline)
print(data)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SmoMark

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫——urllib的使用

Python爬虫——urllib的使用本文使用的版本为Python3，使用的IDE为Pycharm爬取百度首页# 导入模块from urllib import request# 伪装成浏览器headers=("User-Agent", "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, ...
复制链接

扫一扫