C#使用正则表达式过滤HTML代码

对于一些特殊的功能,我们需求对其HTML代码进行过滤,比如不可以进行HTML代码留言等地方.

本文为大家介绍在asp.net下使用C#语言实现的正则表达式过滤HTML代码

以下是过滤HTML代码功能方法.

public static String getTxtWithoutHTMLElement (String element)
  {

  // String reg="< [^< |^>]+>";

  // return element.replaceAll(reg,"");

  if(null==element||"".equals(element.trim()))

  {

  return element;

  }

  Pattern pattern=Pattern.compile("< [^< |^>]*>");

  Matcher matcher=pattern.matcher(element);

  StringBuffer txt=new StringBuffer();

  while(matcher.find())

  {

  String group=matcher.group();

  if(group.matches("< [\\s]*>"))

  {

  matcher.appendReplacement(txt,group);

  }

  else

  {

  matcher.appendReplacement(txt,"");

  }

  }

  matcher.appendTail(txt);

  repaceEntities(txt,"&","&");

  repaceEntities(txt,"< ","< ");

  repaceEntities(txt,">",">");

  repaceEntities(txt,""","\"");

  repaceEntities(txt," ","");

  return txt.toString();

  }
 


  下面是调用方法进行测试

         public void testGetTxtWithoutHTMLElement ()
  {

  assertEquals("test",ExcelHssfView.getTxtWithoutHTMLElement("< a href='a/test'>test< /a>"));

  assertEquals("test",ExcelHssfView.getTxtWithoutHTMLElement("< a href='a/test'>test"));

  assertEquals("test",ExcelHssfView.getTxtWithoutHTMLElement("< input type='text'>test< /input>"));

  assertEquals("test",ExcelHssfView.getTxtWithoutHTMLElement("< p>test"));

  assertEquals("test",ExcelHssfView.getTxtWithoutHTMLElement("< table>< tr>< td>test< /td>< /tr>< /table>"));

  assertEquals("te< st",ExcelHssfView.getTxtWithoutHTMLElement("< p>te< st"));

  assertEquals("te>st",ExcelHssfView.getTxtWithoutHTMLElement("< p>te>st"));

  assertEquals("tst",ExcelHssfView.getTxtWithoutHTMLElement("< p>t< e>st"));

  assertEquals("t< st",ExcelHssfView.getTxtWithoutHTMLElement("< p>t< < e>st"));

  assertEquals("< >test",ExcelHssfView.getTxtWithoutHTMLElement("< p>< >test"));

  assertEquals("< >test",ExcelHssfView.getTxtWithoutHTMLElement("< p>< >test"));

  assertEquals("< < >test",ExcelHssfView.getTxtWithoutHTMLElement("< p>< < >test"));

  assertEquals("test",ExcelHssfView.getTxtWithoutHTMLElement("< table>< tr>< td> test< /td>< /tr>< /table>"));

  }

     原文转自网站制作教程网:http://www.web2bar.cn/Article/3495.aspx

转载于:https://www.cnblogs.com/iawsky/archive/2009/03/15/1412400.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值