python爬虫学习（1）——request库

最新推荐文章于 2024-08-16 17:05:11 发布

Taikx

最新推荐文章于 2024-08-16 17:05:11 发布

阅读量1.4k

点赞数 2

分类专栏： python 文章标签： python request 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Taikx/article/details/118913843

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了Python网络爬虫的基础知识，并详细讲解了如何下载和安装requests库，以及如何使用requests进行网页请求。通过实例演示了访问百度主页并检查状态码，显示了requests库的get方法。同时，文章提到了requests库的七个主要方法，适合初学者入门。

摘要由CSDN通过智能技术生成

文章目录

前言
一、如何下载requests库
二、测试requests安装
三、requests库的七个主要方法

前言

网络爬虫(又被称为网页蜘蛛，网络机器人)，是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。通俗的讲就是通过程序去获取web页面上自己想要的数据，也就是自动抓取数据。

因为python的脚本特性，python易于配置，对字符的处理也非常灵活，加上python有丰富的网络抓取模块，所以两者经常联系在一起。

一、如何下载requests库

首先用管理员权限打开cmd
在这里插入图片描述输入指令 pip install requests 安装requests

pip install requests

如果pip版本过低输入 python -m pip install --upgrade pip 将pip更新到最新版本

python -m pip install --upgrade pip

然后再输入指令 pip install requests 安装requests

想要了解更多request工作信息可以到www.python-requests.org网站上获取
在这里插入图片描述

二、测试requests安装

测试访问百度主页

可以用cmd命令提示符进行操作

首先在cmd中输入指令 python
在这里插入图片描述进到python中开始操作

引进request库

import requests

申请访问百度首页

r = requests.get ("http://www.baidu.com")

查看状态码

r.status_code

此时如果状态码为200，则访问成功，若为404，或者任何非200的状态码皆为没有访问成功
在这里插入图片描述更改编码为utf-8位码

r.encoding = 'utf-8'

打印网页内容

r.text'

在这里插入图片描述

三、requests库的七个主要方法

在这里插入图片描述

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。