头条搜索之站长平台Sitemap提交,与2种不同格式规范
sitemap是为了让搜索引擎能够更快速,效率更高的爬取到页面中链接,所以在站长平台提交网站地图至关重要,接下来对头条搜索的sitemap做介绍(引用自官网):
一、功能说明
· 提交sitemap工具可以向头条搜索提交网站的sitemap文件,帮助头条spider更好的抓取您的网站。您可以在此工具下选择已经验证的站点,进行验证站点的sitemap文件提交。
· sitemap提交后,头条搜索会根据sitemap了解网站中数据情况。
二、sitemap要求
- sitemapindex文件根节点必须是。
- sitemapindex文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>。
- sitemapindex文件禁止使用命名空间,禁止使用规定之外的属性。
- sitemapindex文件大小不得超过5M,sitemap节点数量不超过5W。
- 必须保证sitemap中所有URL可访问,且内容符合XML数据文件规范。
三、XML数据文件规范
- 数据XML文件的根节点必须为
- 数据XML文件编码必须为UTF-8,第一行为: <?xml version="1.0" encoding="utf-8" ?>
- 数据XML文件禁止使用命名空间,禁止使用规定之外的属性。
- 数据XML单个文件大小不得超过10M(必须满足),item数目不得超过1W。
- 除根节点之外的其它节点,标签名建议采用英文小写字母及下划线‘_’
- 数据节点中包含转义字符,请使用CDATA
- 对于数组型的节点,请在只有一个子节点时保证和多个节点时的结构相同
四、Txt格式规范
- Txt文件编码必须为UTF-8
- Txt文件大小不得超过10M,每个文本文件最多可包含5w个网址
- Txt文件每行都必须有一个网址,网址中不能有换行
- Txt文件中不能包含网址列表以外的任何信息
- 必须书写完整的网址,包含http/https
- 必须保证Txt文件中所有URL 可访问,且内容符合Txt数据规范