requests模块
requests模块:Python中原生的一款基于网络请求的模块,功能强大,简单便捷,效率高。
作用:模拟浏览器发请求。
如何使用:
- 指定url
- 发起请求
- 获取响应数据
- 持久化存储
import requests
if __name__=="__main__":
#指定url
url="https://www.sogou.com/"
#发起请求
#get方法返回一个响应对象
response=requests.get(url=url)
#获取响应数据.text返回的是字符串形式的响应数据
page_text = response.text
print(page_text)
#持久化存储
with open('./sogou.html','w',encoding='utf-8') as fp:
fp.write(page_text)
print('爬取数据结束')
这要可以抓取搜狗网页的数据,并且保存。