百度站内搜索php,百度站内搜索全新改版:WordPress生成通用行业模板数据的php脚本...

今早进入百度站长平台查看站内搜索时,发现百度站内搜索已全新升级到2.0版本!原先的站内搜索已经转移到了独立的二级域名:http://zn.baidu.com55403c51e94cb93cc055a4c8590f23d1.png

进一步查看发现站内搜索新增了一个结果页样式设置功能:

dacb16eb847706e8158073d216526fc4.png包含如下三种自定义设置:

①、页面顶部设置

66b315ec1239324c8dc8eba677bceaa4.png

②、频道设置23b5af4d03f805ff6a5e2928912adc3f.png

③、结果样式模板

7729b5062fee12bf17237922d593a439.png

其中我比较感兴趣的是频道设置,可以更加接近搜索引擎的风格,比如百度搜索:

69aa0afd25b586fb4bb164626b24c961.png

仔细研究了一下这个频道设置,发现要区分不同的频道,有2种途径:

①、不同频道使用不同的二级域名(一般大站常有的做法,比如news.163.com);

②、提交行业模板数据,每一组XML数据使用面包屑标签breadCrumb来区分该内容所在频道;

很明显,张戈博客这种简单小站只能选择第二种方案,顺手把以前的sitemap脚本修改了下,就成功提交了!

下面分享这个php脚本的代码:

require('./wp-blog-header.php');

header("Content-type: text/xml");

header('HTTP/1.1 200 OK');

$posts_to_show = 5000;

echo '<?xml version="1.0" encoding="UTF-8"?>';

echo ''

?>

//不带链接的标签函数

function tagtext() {

global $post;

$gettags = get_the_tags($post->ID);

if($gettags) {

foreach ($gettags as $tag) {

$posttag[] = $tag->name;

}

$tags = implode( ']]>

echo '';

}

}

function get_page_title($page_id){

global $wpdb;

$page_title = $wpdb->get_var("SELECT post_title FROM $wpdb->posts WHERE ID = '".$page_id."' AND post_status = 'publish' AND post_type = 'page'");

echo $page_title;

}

/* 文章页面 */

header("Content-type: text/xml");

$myposts = get_posts( "numberposts=" . $posts_to_show );

foreach( $myposts as $post ) { ?>

]]>

monthly

0.6

]]>

post_content));?>]]>

$category = get_the_category();

echo '

$cat_ID = get_cat_ID($category[0]->cat_name);

echo 'url="'.get_category_link($cat_ID).'"/>';

?>

/* 单页面 */

$mypages = get_pages();

if(count($mypages) > 0) {

foreach($mypages as $page) { ?>

ID); ?>]]>

<?php echo str_replace(" ","T",get_page($page->ID)->post_modified); ?>+00:00

monthly

0.6

ID); ?>]]>

ID)->post_content));?>]]>

<?php echo str_replace(" ","T",get_page($page->ID)->post_modified); ?>+00:00

/* 博客分类 */

$terms = get_terms('category', 'orderby=name&hide_empty=0' );

$count = count($terms);

if($count > 0){

foreach ($terms as $term) { ?>

slug); ?>]]>

weekly

0.8

name; ?>]]>

description; ?>]]>

将以上代码保存为sitemap_hy.php上传到WordPress网站根目录即可,然后在浏览器访问这个文件查看效果,比如:

b7a1051527627577c561ccbc6924b56d.png

cabe01227bee698ba4c378f7b2e3415b.png

成功提交后,继续打开频道设置,参考下图将你博客的主要分类填入到相应栏位即可:

f166152bdce51eb2f6b75ec631132a36.png

第二列留空则表示输出全部搜索结果,如果有面包屑,则表示从提交的sitemap中筛出相同面包屑的内容,全部填写完成后点击保存并查看效果了,比如,张戈博客的站内搜索地址:http://so.zhang.ge

提交结果后,就只能等待百度抓取数据并展现了,所以短时间内将如下显示:

3de46aa8929fdee3d90f4649609b74f5.png

隔了一晚上发现张戈博客的站内搜索已经开始展现数据了:

65c7173cb271a82b1f49311b5ae74c4c.png

缩略图和标题都已经有了,但是内容却是一个【略】,再次看了下百度关于这个数据文件的说明。

content:如能提交全文,则不需要spider再抓取,既可以降低站点服务器压力,提升收录效率,也可以避免搜索系统解析误差。

好吧,既然如此,我就再折腾一下,让content输出文章内容!(上文代码已更新!)

最后,如果你对百度站内搜索比较感兴趣,还可以看看张戈博客的其他相关文章:

关于新版站内搜索和行业数据模板的分享就到此告一段落,下面我会继续研究下站内搜索的页面顶部设置和结果样式设置,敬请期待!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值