网络爬虫（一）：requests的基本使用

最新推荐文章于 2024-08-20 17:58:09 发布

封梦

最新推荐文章于 2024-08-20 17:58:09 发布

阅读量317

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/qq_42785117/article/details/82465796

版权

python 专栏收录该内容

22 篇文章 1 订阅

订阅专栏

在学习爬虫的过程中总结一些经验

1.发送请求
第一步：导入request模板

import requests

然后就可以获取一个网页

req = requests.get（url）

get是获取HTML网页的主要方法，对应于HTTP的GET，request模板除了get之外还有很多其他的应用。
譬如说：

req = requests.post(url)
req = requests.put(url)
req = requests.delete(url)
req = requests.head(url)
req = requests.options(url)

2.获取信息
（一）可以通过req.text来获取所爬网站的内容：

import requests
req = requests.get（url）
r=req.text
print(r)

（二）可以使用r.encoding来获取网页编码：

import requests
req=requests.get(url)
r=req.encoding

这样就可以得到该网址的网页编码
（三）req.status_code可以直接获得该网页的状态码。
输出结果为200 该网页可以正常打开，不能正常打开为404

（四）req.headers可以获得响应头内容。
**注意：**是以字典的形式返回内容

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

封梦

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python爬虫：requests模块的基本使用

Hello大家好，我是Dream，如果帮得到你，那我深感荣幸！交流学习、商务合作：https://bbs.csdn.net/topics/614347534

07-17

7万+

在url地址中，很多参数是没有用的，比如百度搜索的url地址，其中参数只有一个字段有用，其他的都可以删除。对应的,在后续的爬虫中，越到很多参数的url地址，都可以尝试删除参数。需求：通过requests向百度首页发送请求，获取百度首页的数据。以上三种方法从前往后尝试，能够100%的解决所有网页解码的问题。我们在使用百度搜索的时候经常发现url地址中会有一个。模拟浏览器，欺骗服务器，获取和浏览器一致的内容。我们先写一个获取百度首页的代码。的方式获取响应的html页面。，那么该问号后边的就是。

网络爬虫（Python：Requests、Beautiful Soup笔记）

算法工程师

11-26

1690

网络爬虫（Python：Requests、Beautiful Soup笔记）

1 条评论您还未登录，请先登录后发表或查看评论

2023全网最全requests库和requests模块使用详解（建议收藏）

m0_58026506的博客

07-14

3290

2023全网最全requests库和requests模块使用详解，还不进来看看！！

req和resp的作用及常用方法

m0_51649818的博客

08-11

1万+

文章目录一、作用二、常用方法1、req2、resp 一、作用 req（request）和（response）对象起到了服务器与客户机之间的信息传递作用。 req对象用于接收客户端浏览器提交的数据，从浏览器端取得数据。 resp对象将服务器端的数据发送到客户端浏览器。二、常用方法 1、req req.setCharacterEncoding() 设置对客户端请求和数据库取值时的编码，只对post请求有效。 // 解决post请求乱码问题 req.setCharacterEncoding("UTF-8

Python之requests模块

最新发布

happy_king_zi的博客

08-20

1953

使用requests可以模拟浏览器的请求，比起之前用到的urllib，requests模块的api更加便捷（本质就是封装了urllib3）注意：requests库发送请求将网页内容下载下来以后，并不会执行js代码，这需要我们自己分析目标站点然后发起新的request请求2、安装requests模块HTTP默认的请求方法就是GET* 没有请求体* 数据必须在1K之内！

request对象中的req.getAttribute和req.getParameter两个方法的区别

MADE_哒哒

06-02

7954

最近学习javaWeb，在Servlet中使用req.getParameter来取值，使用req.setAttribute和req.getAttribute来存取值，对于其作用有一些混乱。所以专门查看了博客作以总结： request对象代表客户端的一次请求，可以用它来存储客户端请求的一些参数。 getParameter()方法该方法是用于客户端传递过来的参数，它的返回值类型永...

reqeusts用法

weixin_34080571的博客

01-09

333

1.request 的简介 Requests 唯一的一个非转基因的 Python HTTP 库，人类可以安全享用。警告：非专业使用其他 HTTP 库会导致危险的副作用，包括：安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。 ——reque...

爬虫(3)request.Request类的介绍和简单爬虫实战

小白的程序猿

04-12

2523

目录request.Request类什么要使用request.Request类?实战爬取www.2345.com主页 request.Request类什么要使用request.Request类? 在我们用程序进行爬虫的时候,网站往往会有一些反爬虫的程序,如果不使用request.Request类,那么浏览器和网站一眼就可以看出这个是一个python代码在请求网页,这时网站会拒绝访问,或者会发送假...

跟着崔庆才学爬虫2：requests库的使用

11-11

崔庆才老师的“跟着崔庆才学爬虫2：requests库的使用”教程主要涵盖了Python爬虫中必不可少的requests库的使用方法。requests库是Python中最常用的HTTP客户端库，用于发送HTTP请求，非常适合进行网页抓取。在这个...

python爬虫入门:requests包的使用

m0_65553347的博客

03-31

3447

python爬虫最常用的requests包的基本使用。

关于req.params、req.param(name)、req.query、req.body等请求对象

AI小美好

04-20

9697

请求对象中最常用的属性和方法：req.params 、req.param(name)、req.query、req.body……等的

request ,response,req.setAttribute()应用及含义和个人理解

qq_45840693的博客

11-18

2143

request ,response,req.setAttribute()应用及含义和个人理解

【NodeJs基础篇】（十一）Express 4.x中request参数的获取

热门推荐

zgljl2012的专栏

11-04

1万+

基本上每一个Http服务器的编程框架都是对request和response的处理。即处理浏览器对服务器的请求（request）和服务器对浏览器的响应（response）。request是浏览器给服务器的请求，一般用到的是两种方法：Post和Get（Express也支持其它方法，如put）。两种方法都会指定路由，除此之外，Get方法的使用场景是浏览器向服务器请求数据，比如访问首页，即向浏览器请求首页内

python--requests模块

qq_34577961的博客

03-09

497

get请求 import requests head = { #存放需要伪装的头信息 'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36' } pram = { "type": "13", "interval_id": "100:90", "action":

requests模块访问api接口小记，requests.request、requests.get和requests.post

wangjinyu124419的博客

12-02

6245

用了些requests模块，主要是requests.request、requests.get和requests.post import json import requests url='http://localhost:8888/' response=requests.get(url) #打印响应内容 print('response.text:',response.text) pri...

python requests获取网页内容(urllib.request和requests的使用和区别)

叶落无痕的博客

08-19

1958

urllib.request和requests的使用和区别请求网页内容可用urllib.request和requests函数,下面分别描述两种函数使用方法 urllib.request的使用 1.发起基础请求 import urllib.request req = urllib.request.Request(url) response = urllib.request.urlopen(req) print(response) 返回结果如下: 返回的是一个object...

requests模块的使用详解

自成背后的博客

10-04

6892

文章目录为什么要重点学习requests模块，而不是urllibrequests模块发送简单的get请求、获取响应使用requests保存图片发送带header的请求url 带参数的两种请求方式使用requests发送POST请求代理ip的使用爬虫中使用cookie 为什么要重点学习requests模块，而不是urllib requests的底层实现就是urllib requests在python2 和python3中通用，方法完全一样 requests简单易用 Requests能够自动帮助我们解压(gz

爬虫第一天:requests模板学习

qq_42874618的博客

01-10

234

本人学习《2020年Python爬虫全套课程（学完可做项目）》记录连接*：https://www.bilibili.com/video/BV1Yh411o7Sz requests模板学习简易网络采集器 if __name__ == "__main__": headers = { 'user-Agent': ... } url = 'https://www.sogou.com/web' kw = input('输入一个单词'); .

Python爬虫实战：Requests到Scrapy框架解析

"Python网络爬虫与信息提取教程，涵盖Requests、robots.txt、BeautifulSoup、Re和Scrapy框架，以及常用Python IDE介绍" 在Python编程领域，网络爬虫是一种用于自动化获取互联网上信息的工具，它可以帮助我们从网页...