使用requests爬取带有证书验证的大学首页

最新推荐文章于 2024-09-26 19:15:00 发布

努力奋斗的小三水

最新推荐文章于 2024-09-26 19:15:00 发布

阅读量91

点赞数 1

文章标签： python 爬虫开发语言

本文链接：https://blog.csdn.net/m0_68441755/article/details/132896707

版权

首先先进行引入所需要的库

import requests
import time

其中引入time是为了设置一个运行延迟

然后进行写入我们需要用到的资源

url="https://www.bucm.edu.cn/"
headers={
    "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.76"
}
wd = {'wd':'中国'}

其中url是所在网页的链接【这个位置使用了北京中医药大学的网站首页】，获取方式是在搜索框中复制

headers获取是在开发人员工具【ctrl+shift+i也可以F12进行打开】，然后找到网络在其中进行复制

wd是一个向链接当中追加属性内容的参数

然后是操作部分

time.sleep(15)
r=requests.get(url,headers=headers,params=wd,verify=False)
r.encoding=r.apparent_encoding
r.raise_for_status()
p= r.text
print(p)

其中verify是设置进行验证的一个参数，如果是true就会对证书进行验证

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

努力奋斗的小三水

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

使用Python爬取天猫商品详情与评论（包含sign加密分析）

吴秋霖的博客

11-28

5256

使用Python爬取淘宝天猫商品详情与评论（包含sign加密分析）

Python的requests库发送HTTPS请求时，SSL证书验证的流程

liuskyter

03-08

3652

关闭SSL证书验证意味着不会验证服务器返回的SSL证书是否有效和可信任，这使得你的应用容易受到中间人攻击的威胁。如果SSL证书验证失败（比如证书过期、证书不受信任、主机名不匹配等），requests库会抛出一个证书验证错误，连接将无法建立。：如果证书验证通过，requests库会使用SSL/TLS协议建立安全连接，确保通信的机密性和完整性。如果你遇到SSL证书验证失败的问题，应该尝试解决证书问题，而不是简单地关闭验证。，请确保你知道潜在的风险，并仔细评估在你的特定情况下是否可以接受这些风险。

参与评论您还未登录，请先登录后发表或查看评论

requests模块-verify参数与ca证书

鹅不糊涂的博客

08-07

693

通过这种方式，你可以绕过SSL证书验证，但请务必确保你所访问的网站是可信的，以避免潜在的安全风险。文章中讲解这个解决方案时，需要明确强调安全风险并提醒读者谨慎使用。有些网站的CA证书没有经过受信任的根证书颁发机构的认证，导致在使用浏览器上访问时会出现类似于12306网站的SSL错误提示。这在某些情况下可能会用到，但需要注意可能存在安全风险。请谨慎使用该参数，并确保你在访问的网站是可信的。参数的作用，确保读者理解该参数的用途。库发送请求时，如果访问的网站存在类似问题，会抛出包含。

[975]python requests实现HTTPS客户端的证书导入

周小董

05-13

3942

最近需要测试一个HTTPS接口，基于CA证书、client key、 client 证书的ssl连接。网上了解到的实现是用python+urllib, import urllib.request import ssl if __name__ == '__main__': CA_FILE = "ca.crt" KEY_FILE = "client.key" CERT_FILE = "client.crt" context = ssl.SSLContext(ssl.PRO

python| requests 访问 https网站

jacklin_01的博客

02-24

1万+

有些网站https需要证书才可以访问, 两种解决方法: 一、指定证书指定一个本地证书用作客户端证书，可以是单个文件（包含密钥和证书）或一个包含两个文件路径的元组 import ssl requests.get('https://kennethreitz.org', cert=('/path/client.cert', '/path/client.key')) 二、忽略证书（不安全）如果你将 verify 设置为 False，Requests 也能忽略对 SSL 证书的验证 import

Python爬虫实战，requests+parsel模块，爬取二手房房源信息数据_使用requests和xpath从搜房网上抓取福州地区的二手房房源信息(要求获取所有分页上(3)

m0_60721860的博客

05-06

1136

别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。这是我花了几天的时间去把Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。最近我才对这些路线做了一下新的更新，知识体系更全面了。

Python爬虫：爬取2023中国软科大学排行榜

01-16

本篇将详细介绍如何使用Python进行网络爬虫，以爬取2023年中国软科发布的大学排行榜为例，带你走进Python爬虫的世界。首先，我们需要了解Python爬虫的基本原理。网络爬虫是通过模拟浏览器发送HTTP请求到服务器，...

Python学习之用Requests和XPath多进程爬取有道单词数据

Leslie_Waong的博客

07-10

546

基础知识爬虫基本原理 1、发起请求使用http库向目标站点发起请求，即发送一个Request Request中包含哪些内容？（1）请求方式主要是GET、POST两种类型，另外还有HEAD、PUT、DELETE、OPTIONS等。（2）请求URL URL全称是统一资源定位符，如一个网页文档、一张图片、一个视频等都可以用URL来唯一来确定（3）请求头包含请求时的头部信息，如User-...

如何使用python爬虫爬取要登陆的网站

09-19

在Python中，我们可以利用`requests`库来模拟浏览器行为，包括发送带有Cookie的HTTP请求。下面以一个实际的例子——“逼乎”网站为例，演示如何使用Cookie进行自动登录： 1. 首先，你需要打开目标网站（例如：...

pythonrequests证书_requests的ssl证书验证、身份认证、cert文件证书

weixin_39893728的博客

12-10

3903

SSL证书：Requests 可以为 HTTPS 请求验证 SSL 证书，就像 web 浏览器一样。SSL 验证默认是开启的，如果证书验证失败，Requests 会抛出 SSLError。在该域名requestb.in上没有设置 SSL，所以失败了。代码如下：# -*- coding: utf-8 -*-import requeststry:requests.get('https://reques...

18 爬虫 - Requests 处理HTTPS请求 SSL证书验证

阿甘兄

08-29

1820

Requests也可以为HTTPS请求验证SSL证书：要想检查某个主机的SSL证书，你可以使用 verify 参数（也可以不写） import requests response = requests.get("https://www.baidu.com/", verify=True) # 也可以省略不写 # response = requests.get("https://www.baidu...

python+requests之二：登陆https网站（设置proxy+SSL证书）

热门推荐

wdlnancy的专栏

02-12

2万+

1、因公司需要通过代理连接外网，故这里需要增加proxies参数，参考：https://blog.csdn.net/wdlnancy/article/details/87007000 2、2.1 忽略SSL证书方法：因登陆的是https网站，需要使用SSL证书，但若无证书进行连接的话，可增加verify=False方法忽略证书验证，但这样会出现如下告警： D:\Python35\lib\...

requests爬取不信任的SSL证书网站

qq_22592457的博客

08-26

1078

一、什么是SSL证书 SSL 证书就是遵守 SSL协议，由受信任的数字证书颁发机构CA，在验证服务器身份后颁发，具有服务器身份验证和数据传输加密功能。 SSL证书通过在客户端浏览器和web服务器之间建立一条SSL安全通道（Secure socket layer(SSL)安全协议是由Netscape Communication公司设计开发。该安全协议主要用来提供对用户和服务器的认证；对传送的数据...

取request中个人的证书

ewsl的专栏

02-26

1542

/** * 取ssldn域 */ java.security.cert.X509Certificate[] certChain = (java.security.cert.X509Certificate[]) req.getAttribute( "javax.net.ssl.peer_certificates");if (certChain != null) { DN

Python爬虫编程思想（23）：使用requests验证ssl证书

一个被知识诅咒的人

09-15

1284

目录 1. 生成私钥文件 2. 生成csr文件 3. 生成证书文件（crt文件）在用requests请求HTTPS URL时，如果证书验证错误，默认会抛出如图1所示的异常。也就是说，requests在默认情况下会对证书进行验证。不过可以使用verify参数将验证功能关掉。verify参数的默认值是True，表示验证证书，如果将verify参数设为False，则会关掉requests的验证功能，但会显示一个警告，可以使用urllib3的disable_warning...

Pyhon : 爬虫Requests高级用法--证书

weixin_44523387的博客

06-02

2244

客户端证书你也可以指定一个本地证书用作客户端证书，可以是单个文件（包含密钥和证书）或一个包含两个文件路径的元组： requests.get(‘https://kennethreitz.org’, cert=(’/path/client.cert’, ‘/path/client.key’)) <Response [200]> 或者保持在会话中： s = requests.S...

requests使用详解

qq_41286824的博客

06-27

3904

requests库是Python中可以用代码来模拟发送网络请求，并得到响应数据的一个第三方库##安装， 3.1.3 基本使用格式 response的常用属性 res.encoding 查看响应正文的编码格式 res.text 查看响应正文的文本内容返回的是一个字符串格式 res.content 查看响应正文的文本内容返回的是一个字节格式如果获取图片数据或者音视频数据通过它直接获取二进制数据并进行保存 res.st

VeighNa：强大的Python开源量化交易平台