爬虫第一步:获取数据

requests对象

在python中,可通过requests库来获取数据。

1.安装requests库

windows系统:在cmd命令窗口中输入:pip install requests
mac系统:在terminal终端软件中输入:pip3 install requests

2.使用requests.get()方法获取资源

requests.get()用法如下:

#引入requests库
import requests

#1.使用requests.get()方法获取资源
#2.将获取到的资源赋值给 an 变量
an = requests.get('www.4399.com')

#打印 an 变量的数据类型,查看通过requests.get()获取的资源是什么类型
print(type(an))

上述代码执行后,会发现 an 变量属于
<requests.models.Response> 类

3.Response对象常用属性

3.1常用属性

属性作用
response.status_code返回响应状态码用于检查连接是否成功
response.content将response对象转化为二进制数据
response.text将response对象转化为字符串数据
response.encoding定义response对象的编码

3.2常用响应码

格式说明意思
1XX收到请求继续提出请求
2XX请求成功访问成功
3XX重定向应使用代理访问
4XX客户端错误禁止访问
5XX服务段错误服务不可用
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值