使用xPath读取html文件

读取一个html文件中的联系人的所有信息

html文件:personList.html

<html>
	<head>
		<title>传智播客1月18号班通讯录</title>
		<meta http-equiv="content-type" content="text/html; charset=UTF-8" />
	</head>
	<body>
		<center><h1>12月16号就业班通讯录</h1></center>
		<table border="1" align="center" id="contactForm">
			<thead>	
				<tr><th>编号</th><th>姓名</th><th>性别</th><th>年龄</th><th>地址</th><th>电话</th></tr>
			</thead>
			<tbody>
				<tr>
				<td>001</td>
				<td>张三</td>
				<td>男</td>
				<td>18</td>
				<td>广州市天河区</td>
				<td>134000000000</td>
				</tr>
				<tr>
				<td>002</td>
				<td>李四</td>
				<td>女</td>
				<td>20</td>
				<td>广州市越秀区</td>
				<td>13888888888</td>
				</tr>
				<tr>
				<td>002</td>
				<td>郭靖</td>
				<td>男</td>
				<td>30</td>
				<td>广州市番禺区</td>
				<td>1342214321</td>
				</tr>
			</tbody>
		</table>
	</body>
</html>

实现的主程序:Demo_xPath_html.java

package xPath;

import java.io.File;
import java.util.List;

import org.dom4j.Document;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

public class Demo_xPath_html {
	public static void main(String[] args) throws Exception{
		Document doc = new SAXReader().read(new File("./src/personList.html"));
		System.out.println(doc);
		//读取title标签
		Element titleElem = (Element) doc.selectSingleNode("//title");
		String title = titleElem.getText();
		System.out.println(title);
		
		/*
		 * 练习:读取联系人的所有信息
		 * 按照以下格式输出:
		 * 		编号:001 姓名:。。。
		 *  	。。。
		 */
		//1.读取出所有的tbody中的tr标签
		List<Element> list = (List<Element>)doc.selectNodes("//tbody/tr");
		//2.遍历
		for(Element elem : list) {
			//编号
			//String id = ((Element)elem.elements().get(0)).getText();//方法一
			String id = ((Element)elem.selectSingleNode("td[1]")).getText();//方法二
			String name = ((Element)elem.elements().get(1)).getText();
			String gender = ((Element)elem.elements().get(2)).getText();
			String age = ((Element)elem.elements().get(3)).getText();
			String address = ((Element)elem.elements().get(4)).getText();
			String phone = ((Element)elem.elements().get(5)).getText();
			System.out.println("编号:"+id+"\t姓名:"+name+"\t性别:"+gender+"\t地址:"+address+"\t电话:"+phone);
		}
	}
}


 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值