# 查看bilibili的robots协议

最新推荐文章于 2023-04-18 23:32:12 发布

hiyunie

最新推荐文章于 2023-04-18 23:32:12 发布

阅读量2k

点赞数 4

本文链接：https://blog.csdn.net/qq_45202835/article/details/104442576

版权

import requests

def GetRobotsHtml(url):
    try:
        result = requests.get(url)
        result.raise_for_status()
        result.encoding = result.apparent_encoding
        return result.text
    except Exception as finalresult:
        return finalresult


if __name__ == '__main__':
    url = 'https://www.bilibili.com/robots.txt'
    r = GetRobotsHtml(url)
    print(r)

爬取结果

User-agent: *
Disallow: /include/
Disallow: /mylist/
Disallow: /member/
Disallow: /images/
Disallow: /ass/
Disallow: /getapi
Disallow: /search
Disallow: /account
Disallow: /badlist.html
Disallow: /m/

由结果可知bilibili允许所有的爬虫对其进行爬取，但也限制了哪些内容是不可爬取的

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hiyunie

关注关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
# 查看bilibili的robots协议

import requestsdef GetRobotsHtml(url): try: result = requests.get(url) result.raise_for_status() result.encoding = result.apparent_encoding return result.text ...
复制链接

扫一扫