ruby 去掉字符串中的html代码讨论

从网上查到rails中去掉字符串中的html标签 的方法如下:

#去掉html标签,取出文本部分 ,并按指定的长度切断返回字符串。
 def strip_html(text,len=0,endss="...")

   if text.length>0
    attribute_key = /[w:_-]+/
    attribute_value = /(?:[A-Za-z0-9]+|(?:'[^']*?'|"[^"]*?"))/
    attribute = /(?:#{attribute_key}(?:s*=s*#{attribute_value})?)/
    attributes = /(?:#{attribute}(?:s+#{attribute})*)/
    tag_key = attribute_key
    tag = %r{<[!/?[]?(?:#{tag_key}|--)(?:s+#{attributes})?s*(?:[!/?]]+|--)?>}
    ss=text.gsub(tag, '').gsub(/s+/, ' ').strip
   
    if len>0 && ss.length>0
    ss=sub_utf8(ss,len,endss)
    end
   end
   return ss
 end

但是在我的工程中不是太起作用,还不如一个小小的正则表达式给力,如下:

@str.gsub(/<\/?.*?>/,"")

我觉得@str.gsub(/<\/?.*?>/,"")也可以把html标签去除的很干净,还没遇到什么问题,上面那个函数确实也很不错,但是。。。。给出参考,希望有兴趣的童鞋可以试试,最好能向我反馈一下效果哈,谢谢大家了。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值