关于这个话题,首先要说的是为什么搜索引擎会不收录带问号的网址。
因为搜索引擎怕由于问号而进入死循环,称为“搜索机器人陷阱“(以前动网就有这样一个漏洞,蜘蛛进去出不来了),所以很多时候带问号的地址搜索引擎是不会进去的,伪静态对于搜索引擎来说,其实就是静态,因为地址中没有带问号,所以没有纯静态比伪静态收录得多的说法。大家看一下,baiduseoV1.0.pdf(这是百度自己写的seo教程)上边的原话
那么为什么选择伪静态呢?
在这里,其实只用一个问题来回答:为什么选择数据库存储信息?
我们当然可以使用纯文本来存储数据,然后做成纯静态的网站。不过这么做我们姑且不谈架构的复杂和开发的成本。我们只说I/O操作的频繁程度,就没有哪个硬盘受的了。删除、更新这些html内容会导致大量的磁盘io操作以及大量的磁盘碎片,就犹如在服务器上24小时的开BT。首先硬盘报废时间会大量缩短,其次运维成本也会提高。
伪静态的坏处
一篇文章的作者所说:"如果流量稍大一些使用伪静态就出现CPU使用超负荷,我的同时在线300多人就挂了,而不使用伪静态的时候同时在线超500人都不挂,我的ISS数是1000。”确实是这样的,由于伪静态是用正则判断而不是真实地址,分辨到底显示哪个页面的责任也由直接指定转由CPU来判断了,所以CPU占有量的上升,确实是伪静态最大的弊病。不过目前来看,在一个网站服务器里面,通常最紧缺的资源是内存,最慢的是硬盘,CPU基本上是低负载运行。
总结
1、使用纯静态和伪静态对SEO来说没有什么区别
2、使用纯静态可能将导致硬盘损坏并将影响网站性能
3、使用伪静态将占用一定量的CPU占有率,大量使用将导致CPU超负荷
4、最重要的一点,我们要静态是为了SEO
综上所述
1、并不建议使用纯静态,因为无论怎么生成,对硬盘来说都是极大的消耗。
2、既然二者的效果一样,我们就可以选择伪静态了。
3、但是伪静态大量使用会照成CPU超负荷。
4、所以我们要谨慎使用。
5、既然静态只是给SEO看的,我们只需要伪静态给SEO就行了,不需要给用户使用。
6、所以我们只要在专门提供给SEO爬的Archiver中使用伪静态就可以了。