URL是Web UI的一部分,应当像对待网站Logo和公司品牌一样对待它,URL是网站和普通用户之间的重要接口,Web项目中,这些都是URI:链接地址(a标签的 href属性);图片的源(img标签的src属性);多媒体文件的源(object标签的src属性);CSS,JavaScript地址(link标 签的href 属性,script标签的src属性)。
网址URL伪静态,Url Rewrite,网址规范化与SEO:
在国内,很多“SEO专家”给客户网站的第一诊断结果就是要页面静态化。这倒不是因为动态页面就做不了SEO,而是相对静态页面而言,动态页面的SEO更加难做,受“SEO专家”的技术能力所限而已。
对于搜索引擎而言,在主观上对静态页面和动态页面并没有特殊的好恶,只是很多动态页面的参数机制不利于搜索引擎收录,而静态页面更容易收录而已。此外,页面静态化在一定程度上也提高了页面访问速度和系统性能及稳定性—-这使得在搜索引擎优化上面,为使得效果更加明显,问题简单快速解决,大家对站点的静态化趋之若骛。
然而对于一些大型网站,静态化带来的问题和后续成本也是不容忽视的:
由于生成的文件数量较多,存储需要考虑文件、文件夹的数量问题和磁盘空间容量的问题—–需要大量的服务器设备;程序将频繁地读写站点中较大区域内容,考虑磁盘损伤问题及其带来的事故防范与恢复—-硬件损耗要更新、站点备份要到位;页面维护的复杂性和大工作量,及带来的页面维护及时性问题—-需要一整套站点更新制度和专业的站点维护人员;站点静态化,增加了更新维护难度和网站管理人员工作强度,增加了硬件设备需求和损耗速度,增加了站点潜在的访问冲突和故障概率。对于一个大型网站而言,这都是必须考虑的问题。
对于SEO优化,我们不需要真正静态化,只需要假装就可以了。动态页面也一样能够做好SEO优化。
目前大多数搜索引擎基本都能收录动态页面,使用动态页面的站点数也远远大于静态页面的站点数。
许多大型网站虽然网址的后缀为.htm,但其实还是动态页面,只是用了URL Rewrite的方式“欺骗”搜索引擎,真正完全静态的没有发现几个。
目前对于一个动态网站,实施相对静态化的做法基本有如下几种:
1. 伪静态,URL Rewrite方式。
2. 类似蜘蛛的方法,动态站点也存在,只是通过一个程序去抓取整个站点并保存发布为需要访问的静态站点。
不论是真静态页面还是伪静态页面,在方便搜索引擎收录这一点上,效果都是一样的。既然如此,为什么不使用效率更高的“相对静态化”的方法,以避免真正静态化所产生的诸多问题呢?
在页面更新维护问题上,即使是伪静态,也带来了不少维护的复杂性和工作量。目前较为可取的更新方式有:
触发式更新:当维护人员在后台更改某些信息后,系统自动或提供手动更新相应显示页面。
独立、分片式更新:更新与维护分开,页面划分为不同的区,根据一定的规则对于区进行更新。区之间的整合与分离,有的是采用活动域,有的是采用SSI(Server Side Include)。
对于独立、分片式更新,应当是大型网站相对静态化后较为理想的更新维护模式:
1. 将各页面定义分区、编号,给定存储规则和更新规则,更新规则分为“依据数据变更更新”和“周期更新”。
2. 对于各区采用优先级的方式,并提供手工触发的即时更新,以保证部分信息的更新时间需要。
3. 静态页面替换动态页面,同时保留动态页面,并在静态页面未生成完毕时采用动态页面代替。
静态化对于网站SEO来说,应当只是一个信号,告诉搜索引擎我的站点很好收录,然后带领搜索引擎尽可能多的“浏览”站点内的内容。只要能够方便浏览和收录,不论是静态页面还是动态页面,搜索引擎都会一视同仁的去收录。
对于小网站而言,站点静态化或许是解决网站收录量的一个简便的办法,而对于大网站来说,则要认真考虑了,是不是真的有必要去做静态化,还是做一下“伪静态”就够了。
网址规范化、标准化设计的宗旨:
URL是Web UI的一部分,应当像对待网站Logo和公司品牌一样对待它,URL是网站和普通用户之间的重要接口,Web项目中,这些都是URI:链接地址(a标签的href属性);图片的源(img标签的src属性);多媒体文件的源(object标签的src属性);CSS,JavaScript地址(link标签的href 属性,script标签的src属性)。
URL应当是用户友好的;URL应当是可读的;URL应当是可预测的;URL应当是统一的;URL面向搜索引擎是友好的;URL设计规则:
1.动态网址静态化——面向搜索引擎友好。动态URL中不超过两个动态参数,不包含区段标识符;2.频道或栏目名称采用英文或全拼形式,推荐采用中文全拼;全拼形式过长采用英文。涉及多个词使用连字符“-”,而不采用下划线“_”;3.简短(short)的URI,避免不必要的冗长(一个URI的长度最好不要超过80个字节/W3C);4.一律采用小写字母,不采用大写形式;5.不采用纸介质打印后难以辨认的字符;6.简单;7.能够反映站点结构;8.管理员可以重新组织服务器上的文件系统结构,而无需改动Url;9.URI不暴露服务器端使用的脚本语言,平台引擎;10.使用标准的Session机制,而不是把Session ID放在URI中;11.删除的URL资源,采用HTTP410重定向;URL变更采用http301重定向;12.目录结构最好用一级到二级。不要超过三级,实现URL简短,合理使用URL资源;13.频道、栏目首页命名:栏目的全拼或英文.html;14.全站内到统一页面的URL形式需要保持统一;15.全站单个页面url保持唯一,杜绝url拼写和语义上的错误;