检查一段文本中的HTML标签是否闭合,若不闭合则修复

本文介绍了一种非正则表达式的方法来检查和修复HTML标签的闭合情况。提供了一个名为TagsList的类,包含检查和修复HTML标签的静态方法。通过测试示例展示了该方法在功能和效率上的表现。
摘要由CSDN通过智能技术生成

    在论坛上看到过几次这样的问题,就写了点放到这里吧 :) 

    Java的正则引擎(java.util.regex)做不到未知层次递归匹配,再说这个用正则效率不会高,所以考虑其他方法实现。对于.Net平台,可尝试一下这个正则:^[^<>]*(?:<(?!/)(?<o>[^/s<>]+)(?:/s[^<>]*)?(?:(?<-o>/>)|>)[^<>]*|(?<-o><//k<o>>[^<>]*))*(?(o)(?!))$ (若闭合返回true,否则返回false。不会忽略单双引号之间的内容,标签也不可以交叉)

    如果要求严格可用xml方式验证,如<div id="test"name="test2"></div>(属性间没空格)等是不能通过的。如果不需要这么严格则可试一下下面的方法(忽略单双引号之间的内容,标签可以交叉):

若用ArrayList存放提取出来的标签效率不佳,就自己写一个TagsList,如下:

/**
 * 存放提取出来的标签
 * 
@author Liw
 * @time 2007-6
 
*/


import  java.util.Arrays;

class  TagsList 
{
    
private String[] data;
    
private int size = 0;

    
public TagsList(int size) 
    
{
        data 
= new String[size];
    }


    
public TagsList() 
    
{
        
this(10);
    }


    
public void add(String str) 
    
{
        ensureCapacity(size 
+ 1);
        data[size
++= str;
    }


    
public String get(int index) 
    
{
        
if (index < size)
            
return data[index];
        
else
            
return null;
    }


    
//为了提高效率,只将其置为null
    public boolean remove(String str) 
    
{
        
for (int index = size - 1; index >= 0; index--{
            
if (str.equals(data[index])) {
                data[index] 
= null;
                
return true;
            }

        }

        
return false;
    }

    
    
public boolean remove(int index)
    
{
        
if (index < data.length) {
            data[index] 
= null;
            
return true;
        }
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 9
    评论
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值