需求:java后台解析下面格式中内容,即获取到div中的内容AAA、BBB、CCC和DDD
<div style="width:100%;height:20px">
<div style="float:left;width:33%;">AAA</div>
<div style="float:left;width:33%;">BBB</div>
<div style="float:left;width:33%;text-align:right;">CCC</div>
<div style="float:left;width:33%;text-align:right;">DDD</div>
</div>
java代码:
//1.先去掉最后一个</div>(html为上面的div块)
html = html.substring(0, html.length()-6);
//2.以<div截取,获取div的个数
String[] divArr = html.split("<div");
//3.for循环不处理前两个,并把值写入htmlArr中(第一个是最外层的不用处理,第二个是截取后的首个为空,也不需要处理)
String[] htmlArr = new String[divArr.length-2];
for(int i =2;i<divArr.length;i++) {
int divIndex = divArr[i].indexOf("<div");
divIndex = divArr[i].indexOf(">", divIndex);
int endDivIndex = divArr[i].indexOf("</div>", divIndex);
String content = divArr[i].substring(divIndex + 1, endDivIndex);
htmlArr[i-2]=content;
}