如何快速找出哪里不符合xml格式_头条搜索之站长平台Sitemap提交,与2种不同格式规范...

头条搜索之站长平台Sitemap提交,与2种不同格式规范

sitemap是为了让搜索引擎能够更快速,效率更高的爬取到页面中链接,所以在站长平台提交网站地图至关重要,接下来对头条搜索的sitemap做介绍(引用自官网):

9e8629e69fcead96bea9301de06221e2.png

头条搜索sitemap

一、功能说明

· 提交sitemap工具可以向头条搜索提交网站的sitemap文件,帮助头条spider更好的抓取您的网站。您可以在此工具下选择已经验证的站点,进行验证站点的sitemap文件提交。

· sitemap提交后,头条搜索会根据sitemap了解网站中数据情况。

二、sitemap要求

  • sitemapindex文件根节点必须是。
  • sitemapindex文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>。
  • sitemapindex文件禁止使用命名空间,禁止使用规定之外的属性。
  • sitemapindex文件大小不得超过5M,sitemap节点数量不超过5W。
  • 必须保证sitemap中所有URL可访问,且内容符合XML数据文件规范。

三、XML数据文件规范

  • 数据XML文件的根节点必须为
  • 数据XML文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>
  • 数据XML文件禁止使用命名空间,禁止使用规定之外的属性。
  • 数据XML单个文件大小不得超过10M(必须满足),item数目不得超过1W。
  • 除根节点之外的其它节点,标签名建议采用英文小写字母及下划线‘_’
  • 数据节点中包含转义字符,请使用CDATA
  • 对于数组型的节点,请在只有一个子节点时保证和多个节点时的结构相同

四、Txt格式规范

  • Txt文件编码必须为UTF-8
  • Txt文件大小不得超过10M,每个文本文件最多可包含5w个网址
  • Txt文件每行都必须有一个网址,网址中不能有换行
  • Txt文件中不能包含网址列表以外的任何信息

- 必须书写完整的网址,包含http/https

- 必须保证Txt文件中所有URL 可访问,且内容符合Txt数据规范

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值