python网络爬虫与信息提取嵩天百度网盘_基于MOOC嵩天《Python网络爬虫与信息提取》视频学习记录——第一周：requests库...

最新推荐文章于 2021-12-25 21:35:09 发布

百通社

最新推荐文章于 2021-12-25 21:35:09 发布

阅读量1.3k

点赞数

本文链接：https://blog.csdn.net/weixin_36202642/article/details/111986934

版权

本文介绍了Python网络爬虫的基础，重点讲解了requests库的使用，包括get、post等方法，以及如何处理编码、异常、设置headers等。通过爬取京东、亚马逊商品，搜索引擎关键词提交，图片下载和IP地址查询等实例，展示了requests库在网络爬虫中的实际应用。

摘要由CSDN通过智能技术生成

1.requests库入门

requests的get( )方法

爬取百度网页实例：

import requests

r = requests.get("http://www.baidu.com")

print(r.status_code)

r.enconding = 'utf-8'

print(r.text)

爬取结果：

requests库的七个主要方法

requsets对象的属性

理解requests的编码

理解requests的异常

爬取网页的通用代码框架

import requests

def getHTMLText (url) :

try:

r = requests.get (url, timeout=30)

r.raise_for_status() # 如果状态不是200，引发HTTPError异常

r.encoding = r.apparent_encoding

return r.text

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注