大部分搜索引擎都会优先考虑收录静态的HTML页面,而不是这种动态的*.jsp、*.php页面。但实际上绝大部分网站都是静态的,不可能的全部是静态的HTML页面,因此互联网的大部分网站都会考虑使用伪静态——就是将*.jsp、*.php这种动态的URL伪装成静态的HTML页面。
下面介绍利用URL Rewrite实现网站伪静态:
(1)下载URL Rewrite的jar包,并将JAR包复制到Web应用的WEB-INF 路径下。
(2)在web.xml文件中配置启用URL Rewrite Filter,在web.xml文件中增加如下配置:
<!-- 配置Url Rewrite的Filter -->
<filter>
<filter-name>UrlRewriteFilter</filter-name>
<filter-class>org.tuckey.web.filters.urlrewrite.UrlRewriteFilter</filter-class>
</filter>
<!-- 配置Url Rewrite的Filter拦截所有请求 -->
<filter-mapping>
<filter-name>UrlRewriteFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
上面的配置中指定使用URL Rewrite Filter拦截所有的用户请求。
(3)在应用的WEB-INF 路径下增加urlrewrite.xml文件,改文件定义了伪静态的映射规则,这份伪静态规则是基于正则表达式的。代码如下:
<?xml version="1.0" encoding="GBK"?>
<!DOCTYPE urlrewrite PUBLIC "-//tuckey.org//DTD UrlRewrite 3.2//EN"
"http://tuckey.org/res/dtds/urlrewrite3.2.dtd">
<urlrewrite>
<rule>
<!-- 所有配置如下正则表达式的请求 -->
<from>/userinf-(\w*).html</from>
<!-- 将被forward到如下JSP页面,其中$1代表
上面第一个正则表达式所匹配的字符串 -->
<to type="forward">/userinf.jsp?username=$1</to>
</rule>
</urlrewrite>
上面的规则文件中只定义了一个简单的规则,所有发向/userinf-(\w*).html 的请求都将被forward到userinf.jsp 页面,并将(\w*) 正则表达式所匹配的内容作为username 参数值。