本文介绍了何为索引型sitemap,以及百度资源平台提交sitemap提示“索引型不予处理”的解决办法。
先来看看百度资源平台的官方说明:
- 文件地址格式为txt或xml,每个地址文件最多包含50,000个网址且需小于10MB。
- sitemap提交工具仅对已验证站点开放使用,开发者无法提交同一主域下其他未验证站点的数据。
- 请勿提交索引型sitemap,索引型不予处理,且若存在索引型sitemap,将不允许提交新文件;请删除索引型sitemap后再尝试提交数据。
- 填写站点的主体备案号,可以提高每日提交上限。
从官方说明中,可以清楚的看到:百度不允许提交索引型sitemap。
什么是索引型sitemap
2020年7月8日,百度搜索资源平台发布了《sitemap提交方式优化公告》,称为提高站点地图文件的处理效率,搜索资源平台常用的采集和死链提交工具不再支持索引站点地图文件(即XML文档嵌套XML文档)。
索引型不予处理
索引型sitemap是指在站点地图(XML格式)内嵌套了另一层XML文档,形成了嵌套的sitemap结构。百度之所以限制索引型sitemap可能原因是为了应对一些灰色网站和站群网站,它们通常包含大量内容,无法采用普通的sitemap文档,因此会采用索引文档的方式。百度可能采取这一措施是为了打击垃圾网站内容,这对于合法的网站来说也是一种好事。
索引型sitemap是如何生成
由于我的网站安装了SEO插件-Rank Math,它是目前最受欢迎的SEO工具之一。也正是用这个插件自动生成的sitemap网站地图。
当打开生成的索引型sitemap.xml文件时,你会注意到其中包含了多个嵌套的XML文件。
索引型sitemap
打开其中一个子sitemap,你可以查看到具体的网站URL列表。
子sitemap下网站URL列表
从上述结构中可以看出,Rank Math插件生成的sitemap采用了XML文档嵌套XML文档的结构,也就是XML文档内包含了另一个XML文档,而不是直接列出网站URL。正是由于这种结构,导致了在提交至百度资源平台时出现了“索引型不予处理”的问题。
如何解决“索引型不予处理”的问题
既然百度资源平台不再支持XML嵌套XML文档这种格式的索引型站点地图文件,解决方法比较简单。我们只需要提交包含网站文章URL列表的最终XML文件即可。
第一步:删除之前提交的总的sitemap
首选需要删除之前提交的总的sitemap。
删除总的sitemap
第二步:添加分站点sitemap
根据你的网站实际情况,你的分站点地图有多少个就需要提交多少次。
值得一提的是,如果你的网站未备案,那么每天只能向百度资源平台提交一条站点地图。如果站点地图数量较少,可以逐一提交。但如果你的站点地图数量较多,可能需要考虑更换插件。有关如何选择并使用合适的站点地图插件,请参考后续文章。
提交子sitemap
需要注意的是,关于“索引型”站点地图,它只是百度不收录的一种形式。而谷歌、Bing等搜索引擎可以正常收录这种类型的站点地图。
第三步:提交后效果展示
提交之后,显示等待,后面等着百度蜘蛛过来抓取就可以了。一旦抓取成功,你的网站sitemap地图就会恢复正常。但有时可能会出现抓取失败的情况,此时你可以尝试删除并重新提交,通常可以解决该问题。
提取URL成功
写在最后
本文通过案例实操的方式详细介绍了百度资源平台提交sitemap提示“索引型”不予处理的具体解决办法。如果你想了解向各大搜索引擎平台提交sitemap的方法,可以参考博文《如何把网站地图sitemap提交至百度、谷歌、Bing搜索引擎》,这边文章有详细解决,希望对你有所帮助。