python爬虫——requests模块学习笔记

最新推荐文章于 2024-07-19 16:36:18 发布

柿子镭

最新推荐文章于 2024-07-19 16:36:18 发布

阅读量97

点赞数

分类专栏： python爬虫文章标签： python 爬虫 request

本文链接：https://blog.csdn.net/weixin_45890771/article/details/122684986

版权

python爬虫专栏收录该内容

22 篇文章 5 订阅

订阅专栏

requests模块

1、urllib模块+requests模块

2、python中原生的一款基于网络请求的模块，作用：模拟浏览器发送请求

3、使用（requests模块的棉麻流程）

（1）指定url

（2）发起请求

——get方法会返回一个响应对象

（3）获取响应数据

——text返回的是字符串形式的数据

（4）持久化存储

4、环境安装

pip install requests

5、实战编码：

爬取搜狗首页的页面数据

import requests

if __name__ == '__main__':
   # 指定url
   url = 'https://www.sogou.com/'
   # 发送请求
   # get方法会返回一个响应对象
   response = requests.get(url)
   # 获取响应数据, text返回的是字符串形式的数据
   page_text = response.text
   print(page_text)
   # 持久化存储
   with open('../sogou.html', 'w', encoding='utf-8') as fp:
      fp.write(page_text)
   print('爬取结束。。。')

柿子镭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫——requests模块学习笔记

requests模块1、urllib模块+requests模块2、python中原生的一款基于网络请求的模块，作用：模拟浏览器发送请求3、使用（requests模块的棉麻流程）（1）指定url（2）发起请求 ——get方法会返回一个响应对象（3）获取响应数据 ——text返回的是字符串形式的数据（4）持久化存储4、环境安装pip install requests5、实战编码：爬取搜狗首页的页面数据import re...
复制链接

扫一扫