对字符串进行正则取子串

题目是这样的:
对一段HTML网页内容,解析出其中所有的键值对,比如其中type=“text”,type为属性,text为值,二者为一个键值对
内容如下:<input type="text" class="s_ipt" name="wd" id="kw" maxlength="100" a="b" autocomplete="off">
拿到这个题,我们首先想到的是怎样遍历,怎样从头到尾的把所有子串取出来,还有如何消掉其中的符号。首先,遍历的方法想了好久,结果不大理想,代码如下,求改进:



	public static void main(String[] args) {

		String zifu = "<input type=\"text\" class=\"s_ipt\" name=\"wd\" id=\"kw\" maxlength=\"100\" a=\"b\" autocomplete=\"off\">";
		
		String zfsz[] = new String[10];
		int a = 0;
		for (int i = 0; i < zifu.length(); i++) {
			
			if (' '==zifu.charAt(i)) {
				
				for (int j = i+3; j < zifu.length(); j++) {
					if (' '==zifu.charAt(j)||'>'==zifu.charAt(j)) {
						zfsz[a] = zifu.substring(i+1, j);
						String temp = zfsz[a].replaceAll("\\W+"," ");
						System.out.println(temp);
						a++;
						break;
					}
				}
			}
			
		}
	}

想的很费劲,写的也很烧脑,最后搜索了一下关于正则表达式,发现String类中split方法就是用正则式对其拆分成数组的,具体参考相关API,这里就不说了。
修改后代码如下:

public static void main(String[] args) {
	String zifu = "<input type=\"text\" class=\"s_ipt\" name=\"wd\" id=\"kw\" maxlength=\"100\" a=\"b\" autocomplete=\"off\">";
	String regex0 = " ";
	//首先,我们以空格将字符串拆分成字符数组
	String[] result0 = zifu.split(regex0);
	//然后对所有字符数组中的非字母元素进行替换
	for (int i = 1; i < result0.length; i++) {
		regex0 = result0[i].replaceAll("\\W+", " ");
		System.out.println(regex0);
	}		
}

嗯,是不是看着简洁多了呢?有更好的方法,在下面可以评论,求指教。。

  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值