如何提交网站给搜索引擎
新开网站,肯定无什么流量,所以,虽然各大搜索引擎每天都放蜘蛛来抓取网页,但很难抓到你的网站,这就是为什么有的网站开通半个月也没有被收录的主要原因。
所以,站长需要主动出击,把网站提交给搜索引擎。
Google说,我们每次抓取网页时都会向索引中添加并更新新的网站,同时我们也邀请您提交您的网址。我们不会将所有提交的网址都添加到索引中,也无法预测或保证这些网址是否会显示以及何时会显示。请注意:您只需提供来自托管服务商的顶层网页即可,不必提交各个单独的网页。我们的抓取工具 Googlebot 能够找到其他网页。Google 会定期更新它的索引,因此您无需提交更新后的或已过期的链接。无效的链接会在我们下次抓取时(即更新整个索引时)淡出我们的索引。
Google的话是具有代表性以及指导意义的。
下面是各大搜索引擎的网站提交入口
如何提交sitemap给搜索引擎
什么是sitemap,从wiki上可以找到的解释是:(通俗的讲就是“网站地图”)
即sitmaps是站点管理员向搜索引擎爬虫公布站点可被抓取页面的协议,sitemap文件内容必须遵循XML格式的定义。每个URL可以包含更新的周期和时间、URL在整个站点中的优先级。这样可以让搜索引擎更佳有效的抓取网站内容。
sitemap分为2种形式:
1、sitemap.html : 这种主要是针对用户而言,让用户能够快速的寻找到自己所需的东西,也是方便搜索引擎来有效的爬取网页内容,提高网站质量。
2、sitemap.xml : 这种格式主要是谷歌自己推出的一种网站地图写法,你可以通过相关规范写出网站地图 然后通过“谷歌管理员工具”提交,这样谷歌的蜘蛛就能有目的的高效的快速的来访问网站,但是 提交的内容 谷歌蜘蛛没有保证一定都会收录!这个误区 请大家要区分开来。
Sitemaps 的XML格式样例:
http://www.webkaka.com/blog/sitemap.xml
目前Google Yahoo和Ask.com支持的最新sitemap标准是0.9版本。sitemap文件必须为utf-8的编码格式,每个sitemap文件只能有一个的顶级标签。
每个标签是对一个URL的描述:
<loc>http://www.webkaka.com/blog/</loc> | 是URL的绝对地址,必须用http或https开头 |
<lastmod>2009-06-04</lastmod> | 是该URL的最后一次修改时间 |
<changefreq>daily</changefreq> | 表示该URL的更新频率,可以设置为daily weekly always |
<priority>0.1</priority> | 是该URL在整个站点的权重,是1.0~0.1之间的数值 |
sitemap文件的限制:
- 必须是utf-8的编码格式
- 每个sitemap.xml文件包含的URL建议不超过5w个URL
- 单个sitemap.xml文件不能超过10M大小
在一个Sitemap索引文件中包括25亿个URL
最近,Google改进了其对Sitemap的支持。其中最重要是增加了支持的Child Sitemap(子Sitemap)的数量。以前,Google对一个Sitemap索引文件最多只能支持1000个子Sitemap,在最近一次的更新中,这个数字变成了50000,这意味着一个Sitemap索引文件中最多可以包含25亿个URL,我相信这已经可以满足一般大型网站的需求了。
提交sitemap有如下两种方式:
- 使用 robots.txt 提交 Sitemap
您可通过向 robots.txt 文件添加以下行(使用您自己的 Sitemap 的完整路径更新示例网址)的方式通知 Google 以及其他搜索引擎有关您 Sitemap 的信息:
Sitemap: http://example.com/Sitemap 位置.xml此指令不受 User-agent 行的影响,因此,您可将其放置在您文件中的任意位置。如果您有 Sitemap 索引文件,那么,您也可以添加该文件的位置。您无需列出索引文件中所列出的每个单独的 Sitemap。
我们仍然建议您通过您的网站管理员工具帐户提交 Sitemap,这样,您可确保 Sitemap 处理无误,并可获得有关您网站的其他统计信息。
- 主动提交sitemap文件
下面是提交入口:
搜索引擎 | 提交地址 |
http://www.google.com/webmasters | |
Bing | http://cn.bing.com/webmaster/ping.aspx?siteMap=你的sitemap.xml地址。这是向MSN直接提交网站地图的后门URL。注意":"被%3A替换掉。 |
Ask | http://submissions.ask.com/ping?sitemap=http%3A//your.domainname/sitemap.xml。注意":"被%3A替换掉。 |
Yahoo! | http://sitemap.cn.yahoo.com/mysites |
baidu | 现在百度不支持Sitemap。可通过http://www.baidu.com/search/url_submit.html来提交你的网址。百度会自行搜索,更新速度很快。 |