python3 url 爬取网页并读写

最新推荐文章于 2024-06-02 18:54:26 发布

零zero度

最新推荐文章于 2024-06-02 18:54:26 发布

阅读量1k

点赞数 1

文章标签： python3 爬虫

本文链接：https://blog.csdn.net/qq_38636998/article/details/82704571

版权

import urllib.request

#向指定的url地址发送请求，并返回服务器相应的数据（文件的对象）
response=urllib.request.urlopen("http://www.baidu.com")

# #读取文件的全部内容,会把读取到的数据赋值给一个字符串变量
# data=response.read()
# print(data)

#将爬取到的网页写入到文件中
# with open(r"C:\untitled\filel.html","wb")as f:
#     f.write(data)

#读取一行代码
#data=response.readline()

#读取全部内容,会把读取到的数据赋值给一个列表变量
data=response.readlines()
'''
print(data)
print(len(data))
print(type(data[100].decode("utf-8")))
'''



#response属性
#返回当前环境的有关信息
print(response.info())


#返回状态码
# print(response.getcode())
# if response.getcode()==200 or response.getcode()==304:
#     #处理网页信息
#     pass


#返回当前正在爬取的url地址
#print(response.geturl())


#解码
# url="******"
# newurl=urllib.request.unquote(url)
# print(newurl)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

零zero度

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python3 url 爬取网页并读写

import urllib.request#向指定的url地址发送请求，并返回服务器相应的数据（文件的对象）response=urllib.request.urlopen("http://www.baidu.com")# #读取文件的全部内容,会把读取到的数据赋值给一个字符串变量# data=response.read()# print(data)#将爬取到的网页写入到文件中#...
复制链接

扫一扫