一键了解获取网页requests方式

桃花坞生动的芒果

已于 2024-01-07 18:50:56 修改

阅读量706

点赞数 10

分类专栏：爬虫文章标签： python 开发语言

于 2024-01-07 18:50:31 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74276368/article/details/135441429

版权

本文介绍了Python爬虫的基础知识，包括爬虫原理、Requests库的安装、文件操作、User-Agent的作用、请求方式（GET和POST）以及实战案例。通过Requests库发起HTTP请求，获取网页源码，并探讨了如何处理文件、模拟浏览器标识以及不同的请求方法。

摘要由CSDN通过智能技术生成

目录

一、爬虫原理：

二、安装：

三、文件的操作

四、认识User-Agent

4.1、为什么用User-Agent：

五、请求方式

六、爬出有中国关键字页面案例

一、爬虫原理：

代码发起请求获取到请求的网页的源码，从源码里面筛选内容

二、安装：

第一步：在终端运行安装命令

pip install requests

第二步：导入模块

import requests

写好会报错说明没有安装

测试：

 resp=requests.get("https://www.baidu.com")
print(resp)

输出响应码200，即代表请求成功

三、文件的操作

r 读取 w 写入 a 追加 b 二进制 + 又读又写

open打开文件夹

mode模式

encoding编码方式

方式一

file=open('a.html',mode='w+',encoding='utf-8')
# 放内容
file.write("")
# 关闭
 file.close()

方式二:

不用手动关闭，自动关闭

with open('a.html',mode='w+',encoding='utf-8') as f:
    f.write("")

方式三

 # 百度的数据保存到网页中
file=pathlib.Path('a.html')
# 写入
file.write_text("hel

最低0.47元/天解锁文章

桃花坞生动的芒果

关注

10
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
一键了解获取网页requests方式

代码发起请求获取到请求的网页的源码，从源码里面筛选内容。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

桃花坞生动的芒果 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。