java解析html

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;

public class ParserHTML {

public static void main(String[] args){
String filePath = "d:\\xx.html";
parseHTML(filePath);
}

private static void parseHTML(String filePath) {
try{
Document document = getDocumentInstance(filePath);
Element root = document.getDocumentElement();
NodeList nodeList = root.getElementsByTagName("form").item(0).getChildNodes();
for(int i=0;i<nodeList.getLength();i++){
Node subNode = nodeList.item(i);
if(subNode.getNodeType() == Node.ELEMENT_NODE){
Element eNode = (Element)subNode;
if(eNode.getTagName().equals("input")){
String name = subNode.getAttributes().getNamedItem("name").getNodeValue().toString();
String value = subNode.getAttributes().getNamedItem("value").getNodeValue().toString();
System.out.println("name=" + name + " value=" + value);
}
}
}
}catch(Exception e){
System.out.println("errMsg: " + e.getMessage());
}
}

private static Document getDocumentInstance(String filePath)throws Exception{
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder db = factory.newDocumentBuilder();
return db.parse(new File(filePath));
}

java解析html表单以获取input值,源码已经过测试。备以后用。
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值