asp里使用正则表达式清除后台编辑器里复制粘贴内容的word格式,将其转换成纯文本;...

     公司客户在使用网站后台编辑添加修改内容时,经常是直接从word文档里复制内容到编辑器里后就提交。结果是在内容显示页面上是五花八门的样式,有时也需要部分纯文本内容作为摘录使用,这些都需要清除word格式。改变客户的习惯要客户先复制到记事本里再粘贴到编辑器里编辑是很难的,所以从我们自己改变起。从网上百度了若干清除word格式的正则,使用效果不甚理想,所以自己写了清除word格式的asp函数,能满足我们自己的使用需求。函数如下:

 

function cleanWord(html)
    dim regEx
    set regEx=New RegExp
    regEx.IgnoreCase=True
    regEx.Global=True
    regEx.Pattern="<[^>]*>"                    '清除所有<>之间的内容
    html = regEx.replace(html,"" )
    regEx.Pattern="{[^}]*}"                     '清除所有{}之间的内容
    html = regEx.replace(html,"" )
    regEx.Pattern="/[^/]*/"                       '清除所有/**/之间的注释
    html = regEx.replace(html,"" )
    html =Replace(html,"table.MsoNormalTable","")        '替换掉漏网的单词
    cleanWord= html
    set regEx=nothing
end function

 

 

 

posted on 2010-04-24 21:42 武汉网福互联 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/fs3000/archive/2010/04/24/1719559.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值