Python爬虫初学

Python爬虫初学笔记


Python爬虫学习
易在炫 今天努力了吗程序狗 昨天
在学习Python提前安装request包,安装方法

用win+R打开控制命令行,然后输入pip install requests(注意要求电脑联网)
在这里插入图片描述

Request对象的属性

安装好requests包之后就开始爬虫学习了,先测试一下我门安装的requests包是否成功,我们就以百度网站做一个测试爬取网站信息、

r.status_codeHTTP请求返回状态,200表示连接成功,404表示连接失败
r.encoding从HTTPheader中猜测响应内容的编码方式
r.textHTTP响应内容的字符串形式,即,url对应页面内容
r.apparent_enconding从内容中分析响应内容编码方式(备选编码方式)
r.contentHTTP响应内容的二进制数

测试代码如下

import requests
re=requests.get("http://www.baidu.com")
print(re.status_code)
print(re.encoding)
print(re.text)
re.encoding='utf-8'
print(re.encoding)
print(re.text)

截图
在这里插入图片描述
在这里插入图片描述
至此百度页面被我们抓取下来了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值