从xml中提取所有的文本

最新推荐文章于 2024-07-16 05:11:56 发布

清河木子

最新推荐文章于 2024-07-16 05:11:56 发布

阅读量2.5k

点赞数

文章标签： xml dom4j

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FYW_wu/article/details/8910568

版权

今天遇到一个需求：从xml中提取所有的文本（或者说是 xml去标签）。写了一会儿，觉得可能别个兄弟也会遇到，就拿出来，看这样妥不妥~

（用dom4j进行解析的）

/**
	 * 提取分散在xml串中的文本
	 * @param xml 如："<a>这<span>是<span>我</span><span>的</span>标题</span>！</a>！！" => 这是我的标题！！！
	 * @return
	 */
	private String getTextFromXml(String xml) {
		Document doc;
		try {
			//保证有一个根节点  所以加了一个warp节点
			doc = DocumentHelper.parseText("<warp>"+xml+"</warp>");
			Element root = doc.getRootElement();
			clearElement(root);
			return root.getTextTrim();
		} catch (DocumentException e) {
			e.printStackTrace();
		}

		return null;
	}

	
	/**
	 * 把 所有子节点 删除掉，但保留节点下面的所有内容 
	 * @param ele
	 * @return
	 */
	private Text clearElement(Element ele) {
		List elepar = ele.content();
		Object tempObj;

		for (int i = 0; i < elepar.size(); i++) {
			tempObj = elepar.get(i);
			if (tempObj instanceof Element) {
				elepar.set(i, clearElement((Element) tempObj));
			}
		}
		
		return elepar.size() > 0 ? DocumentHelper.createText(ele.getTextTrim()) : DocumentHelper.createText("") ;
	}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

清河木子 CSDN认证博客专家 CSDN认证企业博客

码龄14年

28: 原创

14万+: 周排名

149万+: 总排名

7万+: 访问

: 等级

929: 积分

11: 粉丝

6: 获赞

12: 评论

48: 收藏

私信

关注

热门文章

分类专栏

Oracle 2篇
Java 3篇
fastdfs
Activiti 1篇

最新评论

Activiti 指定节点跳转(适合退回、撤回)流程
清河木子: 第二种方法是修改流程定义来实现，这种方式会有并发的问题，如好几个流程实例同时分别跳转到不同的节点去。第三种方法是自定义执行指令（Cmd），具体没试过。个人还是建议采用方式一，这样可以在流程图上面画出业务的闭环，对业务人员友好，没有代码层面的隐藏逻辑。
Activiti 指定节点跳转(适合退回、撤回)流程
ty2244401: 你好，请问一下第二种方法和第三种方法区别是什么
从xml中提取所有的文本
多雨的季节1989: 我遇到了这个问题，试下您的代码
Js RSA 加密、解密，Java RSA 加密、解密
Lnnnnnnnnnnnnnnnnnn: 好人
SpringMVC +Spring+ SpringJDBC整合实例。
oauix: 日志这快没有看懂有log4j.properties的配置,但没有看到哪里应用到

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。