Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitemap提供有关您网站的其他信息,如上次更新日期、Sitemap文件的更新频率等,供百度Spider参考。站点地图(Sitemap)对于提高网站搜索引擎收录的重要程度不言而喻,而能自动生成网站地图的插件更是让众多站长视为必备工具。
1.为什么选择这两款插件
谷歌、微软、雅虎等搜索引擎的支持的站点地图的协议一样的,所以安装Google XML Sitemaps生成的xml格式的站点地图能同时提交给谷歌、微软bing、雅虎等几大搜索引擎,而百度Sitemap是指百度支持的收录标准,在原有协议上做出了扩展,所以必须制作专门针对百度搜索引擎的sitemap,于是一个很牛逼的国人柳城制作了Baidu Sitemap Generator这个插件,能生成针对百度的sitemap,用他的话说就是相当于搜索引擎订阅了你的博客,让你的博客及时被搜索引擎收录。
2.插件的安装与配置
wordpress for sae 的作者在sae版的wordpress里已经内置了Google XML Sitemaps,你只需要到后台启用插件后,然后到设置选项(控制台——设置——XML-Sitemap)选项里修改你想要的设置就行了,默认的就已经很好了,赶紧激动的点击(http://www.ebclub.net/sitemap.xml)看一下我网站的效果吧。
接下来就是Baidu Sitemap Generator的安装,依旧是将插件通过svn 工具放到插件的目录(/wp-content/plugins/),启动插件后,到控制台的设置——Baidu-Sitemap里选择相应的配置,提交,更新xml文件,这时提示在网站根目录生成了sitemap_baidu.xml和sitemap.html两个文件,但是这时候你点击链接,发现直接跳转到了404页面,为什么会出现这种情况呢。
原来这是由于SAE平台的特性造成的,代码空间不支持写入文件,而图片等其他文件都放到了SAE的提供的storage服务里了。
嗯,所以首先要先在Storage中新建一个Domain才能够使用Baidu站点地图,如下图
其实Baidu Sitemap Generator已经考虑到了SAE平台的wordpress,返回这个插件的设置页面发现后面有这两句话(建议直接使用SAE在线编辑代码)提醒:如果是用SAE平台,打开网站根目录下的config.yaml加入两行代码
- rewrite: if ( path ~ "sitemap_baidu.xml" ) goto "wp-content/plugins/baidu-sitemap-generator/SAE_xml.php"
- rewrite: if ( path ~ "sitemap.html" ) goto "wp-content/plugins/baidu-sitemap-generator/SAE_html.php"
然后在/wp-content/plugins/baidu-sitemap-generator 下新建两个文件:SAE_xml.php 和SAE_html.php.
在SAE_xml.php文件里添加如下代码(将我的storage网址改成你的storage网址):
<?php
header("Content-Type:text/xml ");
$f = new SaeFetchurl();
$data = $f->fetch("http://sculinux.sinaapp.com/sitemap_baidu.xml");
//上面的链接就是上图中的storage的sitemap_baidu.xml的实际地址,右键复制链接地址就能得到
echo $data;
?>
接下来在SAE_html.php文件里添加如下代码(同上):
<?php
header("Content-Type:text/html ");
$f = new SaeFetchurl();
$data = $f->fetch("http://sculinux.sinaapp.com/sitemap.html");
//和上面一样,记得要换成你自己的奥
echo $data;
?>
将上面的文件全部保存好,再直接点击链接就可以访问到生成的百度网站地图了。
3.站点地图的提交
谷歌站点地图到谷歌网站管理员处提交就行了,不懂的谷歌一下就行了,其实Google XML Sitemaps这个插件已经很强大了,它会自动通知google,bing,yahoo等搜索引擎你的博客已经更新了。你需要做的就是安安心心写文章就行了。
百度现阶段不开放sitemap的提交,现阶段只会主动邀请质量好的网站提交sitemap,所以内容是网站的价值所在。但你可以将生成的sitemap.html放置在首页,百度蜘蛛是非常喜欢这种文件的,从而保证你的网站及时收录。
4.robots的设置
百度蜘蛛或者谷歌蜘蛛在爬行一个网站是会先检查网站robots协议的要求的,可以在robots告诉蜘蛛站点地图的位置,提高网站的收录量。方法新建一个robots.txt文件,添加如下代码(注意将下面的网址改成你自己网站的网址),保存后上传到网站根目录:
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Sitemap: http://sculinux.sinaapp.com/sitemap.xml
Sitemap: http://sculinux.sinaapp.com/sitemap_baidu.xml
Sitemap: http://sculinux.sinaapp.com/sitemap.html
5. 在网站首页添加站点地图的链接
打开./wp-content/themes/twentyeleven/footer.php,还在合适的地方的添加以下代码就OK了
<!-- Google Site Map-->
<a href=http://sculinux.sinaapp.com/sitemap.xml target="_blank" title="Google Site Map"><?php printf( __( 'Google Site Map', 'twentyeleven' )); ?></a>
<!-- Baidu Site Map-->
<a href=http://sculinux.sinaapp.com/sitemap.html target="_blank" title="Baidu Site Map"><?php printf( __( 'Baidu Site Map', 'twentyeleven' )); ?></a>
Refer: http://www.ebclub.net/archives/359.html