python3 url 爬取网页并读写

import urllib.request

#向指定的url地址发送请求,并返回服务器相应的数据(文件的对象)
response=urllib.request.urlopen("http://www.baidu.com")

# #读取文件的全部内容,会把读取到的数据赋值给一个字符串变量
# data=response.read()
# print(data)

#将爬取到的网页写入到文件中
# with open(r"C:\untitled\filel.html","wb")as f:
#     f.write(data)

#读取一行代码
#data=response.readline()

#读取全部内容,会把读取到的数据赋值给一个列表变量
data=response.readlines()
'''
print(data)
print(len(data))
print(type(data[100].decode("utf-8")))
'''



#response属性
#返回当前环境的有关信息
print(response.info())


#返回状态码
# print(response.getcode())
# if response.getcode()==200 or response.getcode()==304:
#     #处理网页信息
#     pass


#返回当前正在爬取的url地址
#print(response.geturl())


#解码
# url="******"
# newurl=urllib.request.unquote(url)
# print(newurl)
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值