Title和Meta标签
标题(title):
网页优化可以说是从title开始的,在搜索结果中,每个抓取内容的第一行显示的文字就是该页的title,同样在浏览器中打开一个页面,地址栏上方显示的也是该页的title.因此,title可谓一个页面的核心.对Title的书写要注意以下问题:
1.Title简短精炼,高度概括.含有关键词,而不是只有一个网站名称.但关键词不宜过多,不要超过3个词组.
2.前7个字对搜索引擎最重要,因此关键词位置尽量靠前.总字数不超过30个汉字.
例如: google手机搜索,可以砍到排在前面的几个都是大公司手机频道,手机这个词是排在最前面的.
Meta属性 关键词(Keywords):
Keywords 提示搜索引擎:本网站内容围绕这些词汇展开.
因此keywords书写的关键是每个词都能在内容中找到相应的匹配才有利于排名.
例如: 网易手机频道. 关键词时"手机,手机报价,诺基亚,摩托罗拉"不过最近搜索引擎对Keywords属性的权重降低,不如原来那么重要了.
描述(Description)
描述部分用简短的句子告诉搜索引擎和访问者关于本网页的主要内容.用该网站的核心关键词搜索后得到的搜索结果中,描述往往显示为标题后的几行描述文字.Description一般被认为重要性在title和keywords之后.描述的书写要注意以下问题:
1.描述中出现关键词,与正文内容相关,这部分内容是给人看的,所以要写的很详细,让人感兴趣,吸引用户点击
2.同样遵循简短原则,字符数含空格在内不要超过120个汉字.
3.补充在title和keywords中未能充分表述的说明.
例如:www.51edu.com 的在Google搜索结果里面描述:中国领先的教育门户和国内最大的招生引擎,为用户提供万门优质课程优惠报名服务,为教育机构提供基于互联网的招生营销,市场管理,品牌宣传等专业化服务.
另外百度对页面最开始的内容比较感兴趣,通常以这部分内容作为现实结果.
例如:http://www.baidu.com/s?wd=site%3Awww.51edu.com&cl=3 显示的页面菜单栏:
首页 商学院/研究生 高考 中小学 外语 IT 职业教育 管理 考研 留学 音乐美术体育 使馆文教处 专区 社区 高级搜索 拉萨尔三年国际本科 考研
其他Meta标签:
为了限制搜索引擎对内容的抓取,可以采用以下几个Robots Meta 标签:
<meta name="Robots" content="all|none|index|noindex|follow|nofollow|noarchive">
其中: all - 文件将被检索,且页面上的链接可以被查询
none - 文件将不被检索,且页面上的链接不可以被查询
index - 文件将被检索
follow - 页面上的链接可以被查询.
noindex - 文件将不被检索,但页面上的链接可以被查询
nofollow - 文件被检索,页面上的链接不被查询.
noarchive - 文件不被缓存
这些值是可以组合在一起使用.
说道这里,不得不提一下Google另外的一个属性 rel="nofollow". 使用方法:
<a rel="nofollow" href="http://www.1234567.com"> 小电影</a>
作用呢:就是告诉搜索引擎这个链接不是经过作者自己编辑的,所以这个链接不是一个可信任的链接.搜索引擎看到这个标签就可能减少或完全取消链接的投票权重.但并不是所有的搜索引擎都支持meta中的robots标签.
综合运用样例:
<title>亲自教育-万花筒儿童教育集团</title>
<meta name="Robots" content="all">
<meta name="keywords" content="亲自教育">
<meta name="description" content="对于亲子教师来说系统完善的亲子游戏教具是他们在亲子活动前必不可少的实用性教材,北京智泉万花筒教育研究院亲子中心为教师及加盟商提供全套的亲子游戏教具">
访问结构
访问结构即通过几层访问到最终页面,Google最好为三层,百度不限
较好的例子:
以 www.seochat.org为例.
www.seochat.org首页为第一层, 百度优化为第二层,百度如何优化为第三层.这样的结果便与搜索引擎索引.百度如何优化这个页面在百度和google里面都有收录.
二级域名访问结构:
由于三层的目录,容纳的页面有限,需要多级目录.
这个时候使用前面我们讲过的二级域名方式扩大级数.因为二级域名算独立网站,目录层次从当前二级域名算起.
外域访问结构:
有的网页在本网站层数很多,但也被Google收录,这是因为这些网页在被其他网站引用,而Goole从其他页面进入这个页面.可以使用Link命令查询该页的反相链接.
目录和文件命名
目录和文件名称中的关键词
目录名称和文件名称中可以使用到关键词.如果是关键词组,则需要用分隔符分开.我们常用连字符"-" 和下划线"_"进行分割,URL中还经常出现空格码"%20". 因此,如果以"中国制造"作文件名,就可能出现以下三种分隔形式:
made-in-china.htm
made_in_china.htm
made%20in%20china.htm
连在一起之后,关键词就失去了意义.但事实上,至少在目前Google并不认同"_"为分隔符.对Google来说,made-in-china和made%20in%20china都等于 made in china,但made_in_china就被读成了madeinchina.
因此,目录和文件名称如果有关键词组,要用连字符"-" 而不是下划线"_"进行分隔.
URL应该越短越好
有人为了单纯增加关键字而额外建多一个带有关键字的子目录,改变目录结构.由于URL中含有关键字本身对排名提高帮助并不大,因而这种做法多此一举,也是搜索引擎反感的.
不好的例子:
要做英文关键词computer,这样的目录 http://www.ibm.com/computer/computer/computer.html是错误的.
好的例子:
http://www.ibm.com/computer/ 该目录在根目录下的第一级,权重相对第二级较大.
GB2312中文路径
现在搜索引擎对GB2312的中文URL能正常收录了.优化无处不在,URL上的关键词相比较题权重要少一些,但还是有效,有条件可以增加上.
动态网页静态化
虽然大多数搜索引擎的蜘蛛程序现在基本都可以解读符号"?"后的字符,但搜索引擎更喜欢静态文件,所以要对动态网页静态化.
在介绍静态化之前,介绍一些常用的正则表达式:
符号 | 匹配字符 | 示例 |
---|---|---|
/d | 任何十进制数字 | 等价于[0-9] |
/D | 任何非数字 | 等价于[^0-9] |
/s | 任何空白字符 | 空格,制表符,分页符 |
/S | 任何非空白字符 | 等价于"[^/f/n/r/t/v]" |
/w | 任何单词字符 | 等价于"[A-Za-z0-9_]" |
/W | 任何非单词字符 | 等价于"[^A-Za-z0-9_]" |
/n | 回车换行 | |
. | 除/n以外的任何字符 | (.)+匹配除换行符以外的所有字符串 |
? | 0个或1个前面的字符 | ab?c? 可以且只能匹配"abc","abbc","abcc"和"abbcc" |
* | 0个或多个所有的字符 | ab* 可以匹配"ab","abb","abbb" |
+ | 1个或多个所有字符 | ab+ 可以匹配"abb","abbb"等,但不匹配"ab" |
{n} | n表示数量,如果是2,表示2个字符 | a{2} 可以匹配"aa",但不匹配"a" |
{n,n} | 从几个字符开始到几个字符结束,如果不写,表示至少或者至多 | a{3,} 匹配"aaa","aaaa"等,但不匹配"a"和"aa" |
x|y | 匹配"x"或"y" | "ab(c|x)yz"匹配 "abcyz" 和 "abxyz" |
/? /. /* + | ? . * + |
这种介绍下几种静态化方法:
1.使用IIS_ReWrite 静态化处理,适合PHP,ASP,ASP.NET程序.
2.使用虚拟主机的ASP网站,需要使用404错误操作实现静态化.
3.使用asp.net开发的网页程序,使用URLRewriter.all实现静态化.
4.基于Apache HTTP Server 静态化
5.静态化后文件格式
框架结构
框架结构,即帧结构(Frame),包括IFrame,Frame.
框架型网站的优越性体现在页面的整体一致性和更新方便上.尤其对于那些大型网站而言,框架结构的使用可以使网站的维护变得相对容易.但框架对搜索引擎来说是一个很大的问题,这是由于大多数搜索引擎都无法识别框架,也没有什么兴趣去抓取框架中的内容.此外,某些浏览器也不支持框架页面.
如果网页已经使用了框架,或出于某种原因一定要使用框架结构,则必须在代码中使用"Noframes"标签进行优化,把Noframe标签看做是一个普通文本内容的主页.在<Noframe></Noframe>区域中包含指向frame页的链接以及带有关键词的描述文本