[转]使用正则表达式优化网页代码

最新推荐文章于 2021-08-31 18:19:33 发布

andylaufzf

最新推荐文章于 2021-08-31 18:19:33 发布

阅读量561

点赞数

分类专栏： C#学习文章标签：正则表达式优化 dreamweaver 文本编辑 html 工具

C#学习专栏收录该内容

83 篇文章 0 订阅

订阅专栏

使用正则表达式优化网页代码

正则表达式最早在perl语言中出现，在此之前为了测试字符串中是否存在某个字符，不得不使用如ChatAt()、indexOf()等函数对字符串循环校验。一旦验证的条件复杂起来（比如身份证校验）实现就变得相当繁杂和艰巨。为此人们就发明了正则语法，使用一个特殊的字符串作为模板，对输入的字符流进行匹配，这跟电子厂的PCB板检测原理很相似。正则表达式在不同工具中实现方式虽然有点不同，但表达语法相同，一般都遵循了ECMPScript 的RegExp类语法标准，具体可以查看，《 ECMAScript Language Specification》中有关RegExp的描述，如果想深入了解正则表达式， http://www.regular-expressions.info/是个不错的网站。

网页代码优化的最主要工作的就是对页面源代码的简化。对于用网页工具或其他转换工具（比如Word—>Html）制作的网页，简化与未简化的网页大小相差往往在一倍以上。别小看简化的作用，对于目前的互联网带宽来说，将50kb的页面缩小成20kb可能感觉不到浏览速度的提升，但对小型手持设备如手机、PDA来说，这是非常致命的，不仅是带宽的问题，页面代码越多，浏览器解析与导航（定位）的速度就越慢，消耗的内存也越厉害。网页代码的精简程度是衡量网页设计人员水平高低的一个重要标准。

闲话说了这么多，现在进入正题。代码简化工作是通过对文本进行“查找替换”实现的。普通的全字符串匹配的查找替换可以帮我们完成大部分的代码简化功能，对于有条件的简化，必须使用正则表达式进行处理。基本上带有文本编辑功能的编辑器（比windows写字板高级点的）都带有支持正则表达式的“查找替换”功能。由于是对网页代码进行优化，因此我们还是使用专门的DreamWeaver或FrontPage进行操作。这两个工具都带有html代码优化功能，但基本上都不能满足我们的要求。而且优化的功能都可以通过使用正则表达式进行实现。FrontPage正则表达式的很多标记跟标准的不同(真不明白ms为什么老是要自己搞另外一套-_-!!），这里我只介绍适合DreamWeaver的方法。

应用一：删除空白标签

像、这类页面编辑后遗留的空白标签是可以清理的，但要注意的是，在一些应用中（如ajax的回显）可能会用到一些有id属性的空白标签。