Python网络爬虫学习笔记一

from urllib2 import urlopen
html = urlopen("http://www.csdn.net")
print(html.open())
1. urllib 是Python 的标准库,包含了从网络请求数据,处理cookie,改变请求头和用户代理这些元数据的函数。Python 2.x 中使用urllib2 库,urllib2 与urllib 有些不同,在Python 3.x 里,urllib2 改名为urllib,被分成一些子模块:urllib.request、

urllib.parse 和urllib.error,尽管函数名称大多和原来一样,但是在用新的urllib 库时需要注意哪些函数被移动到哪一个子模块里。

2.urlopen 用来打开并读取一个从网络获取的远程对象。它是一个通用的库,可以读取HTML 文件、图像文件,或其他任何文件流

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值