1、request模块
request模块:python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高
2、如何使用
如何使用:(request模块的编程流程)
- 制定url
- 发送请求
- 获取响应数据
- 持久化存储
3、环境的安装
pip install requests
反爬机制:
UA伪装:让爬虫对应的请求载体身份标识伪装成某一浏览器
UA:User-Agent(请求载体的身份标识)
UA检测:门户网站的服务器会检测对应请求的载体身份标识,如果检测到请求的载体身份标识为某一浏览器,说明该请求是一个正常的请求,但是如果检测到请求的载体身份标识不是某一浏览器,则表示该为不正常的请求(爬虫).则服务器就很有可能拒绝该次请求
案例: