Linux服务器出现爬虫的报错

酒醉的胡铁

已于 2023-12-26 10:31:28 修改

阅读量1.2w

点赞数 10

分类专栏： Linux 文章标签：服务器 linux 爬虫

于 2023-12-26 10:30:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43691884/article/details/135215715

版权

Linux 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

问题

发现运行中的服务器总是出现类似错误
在这里插入图片描述

因为端口开放所以导致一直被各大搜索引擎的爬虫检索，网上没人说，唯一的办法还是关闭开放端口那肯定不行

在spring - jHipster Undertow request failed HttpServerExchange - Stack Overflow找到

It's the search crawler to get url not found,throw the error,you can write robots.txt to prohibit it on the root directory.

解决方案

在网站的根目录下添加 robots.txt

robots.txt是一种存放于网站根目录下的ASCII编码的文本文件，它通常告诉网络搜索引擎的漫游器（又称网络爬虫/蜘蛛），此网站中的哪些内容是不能被搜索引擎的漫游器获取的，哪些是可以被获取的。
当robots访问一个网站时，首先会检查该网站中是否存在这个文件，如果机器人找到这个文件，它就会根据这个文件的内容，来确定它访问权限的范围
因为一些系统中的URL是大小写敏感的，所以robots.txt的文件名应统一为小写。

写法注意

所有字母需要用英文输入法
与 * 之间需有一个英文输入法的空格
与 / 之间需有一个英文输入法的空格

例子：禁止任何搜索引擎索引网站的所有部分

User-Agent: *
Disallow: /

酒醉的胡铁

关注

10
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
Linux服务器出现爬虫的报错

发现运行中的服务器总是出现类似错误因为端口开放所以导致一直被各大搜索引擎的爬虫检索网上没人说，唯一的办法还是关闭开放端口那肯定不行在找到。
复制链接

扫一扫

专栏目录

酒醉的胡铁 CSDN认证博客专家 CSDN认证企业博客

码龄6年

114: 原创

23万+: 周排名

1万+: 总排名

104万+: 访问

: 等级

2335: 积分

938: 粉丝

1178: 获赞

11: 评论

950: 收藏

私信

关注

热门文章

分类专栏

Oracle 3篇
SpringCloud 1篇
Git 8篇
Redis 4篇
SpringBoot 25篇
idea 7篇
maven 6篇
java 6篇
eclipse 3篇
前端 5篇
mysql 8篇
Jenkins 9篇
Android 2篇
Linux 20篇
Docker 12篇
其他 7篇

最新评论

Docker Desktop windows 安装各种插件
普通网友: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Docker Desktop windows 安装各种插件
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Oracle数据库初使用
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Docker容器没有vim和基础命令
Codigger官方: Docker 容器中的 CentOS 基础镜像是没有 ip、addr、ifconfig、ping 等命令的。因为这些命令通常用于管理网络配置，而容器通常使用虚拟网络进行连接。除此之外还有使用其他工具来管理容器的配置方案可以分享吗？
Android APP开机自启动基本方法
ITV女诗人: 有空来看看我朋友的作品, 码农宝App (同时提供小程序版本), 可以让你体验功能及学习代码的App, https://blog.csdn.net/lujianfeiccie2009/article/details/112645439

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。