AppleWebKit/537.36(KHTML,likeGecko)与cdn讲解

WebKit 是一个开源的浏览器引擎,与之相对应的引擎有Gecko(Mozilla Firefox 等使用),Trident(也称MSHTML,IE 使用)和EdgeHTML(也称Chakra,Edge和其他UWP浏览器使用)。

Apple开发了Safari,使用了KHTML,同时也增加了很多新特性,后来另起炉灶叫了WebKit,但是它有希望能够看到那些为KHTML编写的网页,于是Safari标称自己为Mozilla/5.0 (Macintosh; U; PPC Mac OS X; de-de) AppleWebKit/85.7 (KHTML, like Gecko) Safari/85.5,就更加混乱了.

Google也开发了自己的浏览器Chrome,使用了Webkit,有点像Safari,希望能看到为Safari编写的网页,于是决定装成Safari。Chrome使用了WebKit渲染引擎,想装成Safari,Chrome宣称自己是Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/525.13 (KHTML, like Gecko)Chrome/0.2.149.27 Safari/525.13

最后:

IE伪装成 Mozilla
webKit 伪装成 KHTML
KHTML 伪装成 Gecko

最后 opera 伪装成上面任何浏览器

同时所有的浏览器又都宣称自己是 Mozilla

其实AppleWebKit/537.36(KHTML,likeGecko)就是设备内核版本号

CDN的全称是Content Delivery Network,即内容分发网络。CDN是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。CDN的关键技术主要有内容存储和分发技术。
在这里插入图片描述
一个程序,比较小的可能只有一个服务器,但是像淘宝,京东,或者银行,后台都会有很多个服务器,比如:类似于银行,各个地方都有ATM机可以取款,取款的时候可以到最近的ATM机去取,省时省力,各个地方的ATM机又是和总的处理中心是连接的,可以说是总的交易中心分发到了各个地方的ATM机。服务器这个时候的服务器就相当于ATM机器。

在不同地方域名通过域名解析服务器解析出来的IP,是各个地方的cdn服务器,cdn服务器再把数据转发到真实的服务器。

CDN应用广泛,支持多种行业、多种场景内容加速,例如:图片小文件、大文件下载、视音频点播、直播流媒体、全站加速、安全加速。

要使用 Python 中的 requests 库来爬取 B 站视频,你需要了解一些基本的知识。 首先,B 站的视频链接格式通常为:https://www.bilibili.com/video/av + 视频 ID 。例如,一个视频链接为 https://www.bilibili.com/video/av12345678 ,其中 12345678 是该视频的 ID。 接下来,你需要使用 requests 库向 B 站服务器发送请求,并使用正则表达式从响应中提取视频链接。下面是一个简单的示例代码: ```python import requests import re url = 'https://www.bilibili.com/video/av12345678' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36' } response = requests.get(url, headers=headers) html = response.text pattern = re.compile(r'"url":"(https://upos-hz-mirrorks3u.acgvideo.com/upgcxcode/\S*?&cdn=\S*?)",') match = pattern.search(html) if match: video_url = match.group(1) print(video_url) else: print('未找到视频链接') ``` 在这个示例代码中,我们首先定义了视频的链接和请求头信息。然后使用 requests 库向 B 站服务器发送 GET 请求,并将响应的 HTML 文本保存在变量 html 中。 接下来,我们使用正则表达式从 HTML 文本中提取视频链接。这里我们使用了一个正则表达式模式,可以匹配 B 站视频链接中的视频地址。如果找到了视频链接,我们就将其打印出来。如果没有找到视频链接,则打印“未找到视频链接”。 需要注意的是,B 站视频链接可能会过期或被删除,因此该方法并不总是可靠的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Recently 祝祝

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值