百度小程序html解析图片过大_百度蜘蛛抓取如何识别

ece9f75380e93042d340991b3c9d091f.png

SEO小白,初出茅庐时会听说百度蜘蛛抓取云云,那这个蜘蛛抓取是个什么呢?它要干啥呢?

百度蜘蛛,它是百度的一个自动化程序,它的主要工作是收集整理互联网的页面、图片、视频等,从而分类建库,让用户在百度搜索中检索到需要的内容。

5932c7bda3b7bbe07a81eb0a5228ea41.png

在SEO优化的过程中,经常有人问:“最近百度蜘蛛来的太频繁服务器抓爆了,怎么办?”“最近百度蜘蛛都不来了怎么办”还有很多站长想要得到百度蜘蛛的IP段,并把他们加入到IP白名单中,但是IP却不固定。那站长们该怎么正确识别百度蜘蛛呢?

1、查看UA,如果UA都不对,可以直接判断非百度搜索的蜘蛛,目前对外公布过的UA是:
移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
PC UA:Mozilla/5.0 (compatible; Baiduspider/2.0;+http://www.baidu.com/search/spider.html)
新增渲染UA:
移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)

PC UA:Mozilla/5.0 (compatible;Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
2、反查IP
站长可以通过DNS反查IP的方式判断某只spider是否来自百度搜索引擎。根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:
1)、在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.http://baidu.com 或 *.http://baidu.jp 的格式命名,非 *.http://baidu.com 或 *.http://baidu.jp 即为冒充。

215ab355b4df9d0a2461b63d8059c8b0.png

2)、在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup http://xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以*.http://baidu.com 或*.http://baidu.jp 的格式命名,非 *.http://baidu.com 或 *.http://baidu.jp 即为冒充。
3)、 在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig http://xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.http://baidu.com 或*.http://baidu.jp 的格式命名,非 *.http://baidu.com 或 *.http://baidu.jp 即为冒充。

以上内容是由华联纵横商务提供,如果大家有业务上的类似需求,可直接联系华联纵横客服咨询。他们的技术水平的确不错。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值