Python爬虫初学笔记
Python爬虫学习
易在炫 今天努力了吗程序狗 昨天
在学习Python提前安装request包,安装方法
用win+R打开控制命令行,然后输入pip install requests(注意要求电脑联网)
Request对象的属性
安装好requests包之后就开始爬虫学习了,先测试一下我门安装的requests包是否成功,我们就以百度网站做一个测试爬取网站信息、
r.status_code | HTTP请求返回状态,200表示连接成功,404表示连接失败 |
---|---|
r.encoding | 从HTTPheader中猜测响应内容的编码方式 |
r.text | HTTP响应内容的字符串形式,即,url对应页面内容 |
r.apparent_enconding | 从内容中分析响应内容编码方式(备选编码方式) |
r.content | HTTP响应内容的二进制数 |
测试代码如下
import requests
re=requests.get("http://www.baidu.com")
print(re.status_code)
print(re.encoding)
print(re.text)
re.encoding='utf-8'
print(re.encoding)
print(re.text)
截图
至此百度页面被我们抓取下来了