牧佑---oneonezeroDream---jsoup解析html

有一段不规则的html 文字需要解析,其实很简单的一个问题


从网上下载一个jsoup,jar包。然后就是干

package webDemo;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;

public class DeadLockMarker {
public static void main(String[] args) {
	String sdf = "<divstyle=\"line-height:1.7;color:#000000;font-size:14px;font-family:Arial\"><br/><br/><br/><br/><br/><divstyle=\"position:relative;zoom:1\"></div><div id=\"divNeteaseMailCard\"></div><br/><divid=\"isForwardContent\">--------转发邮件信息--------<br/>发件人:\"柳州丹顺机械有限公司\"lt;liuzhoudanshun@163.comgt;<br/>发送日期:2017-07-2511:29:22<br/>收件人:lfzhilianglt;lfzhiliang@163.comgt;<br/>主题:Re:供应商质量例会会议纪要2017-7-18(2)<br/><divstyle=\"line-height:1.7;color:#000000;font-size:14px;font-family:Arial\"><br/><br/><br/><br/><br/><divstyle=\"position:relative;zoom:1\"></div><div></div><br/>在2017-07-2116:15:04,\"lfzhiliang\"lt;<ahref=\"mailto:lfzhiliang@163.com \r\n" + 
			"\r\n" + 
			"\">lfzhiliang@163.com</a>gt;写道:<br/><blockquoteid=\"isReplyContent\"style=\"PADDING-LEFT:1ex;MARGIN:0px0px0px0.8ex;BORDER-LEFT:#ccc1pxsolid\"><styletype=\"text/css\">BLOCKQUOTE{margin-Top:0px;margin-Bottom:0px;margin-Left:2em}</style><styletype=\"text/css\">body{border-width:0;margin:0}img{border:0;margin:0;padding:0}</style><stationery><div></div><div>各供应商:</div><div>以上是7月份质量例会会议纪要,请按纪要要求,开展相关工作。8月10日前,把相关工作完成情况证据,插入会议纪要回复到该邮箱。</div><div>柳福技术质量部</div><div>&p;柳福技术质量部</div><div>&\r\n" + 
	
			"";
	String sf =DeadLockMarker.getTextContentHtml(sdf);
	System.out.println(sf);
}
public static String getTextContentHtml(String htmlConter) {
	/*Document parse = Jsoup.parse(htmlConter);
	String text = parse.text();
	StringBuilder sb = new StringBuilder(text);
	int index =0;
	while(sb.length()>index)
	{
		
		char tmp = sb.charAt(index);
		if(Character.isSpaceChar(tmp) || Character.isWhitespace(tmp))
		{
			sb.setCharAt(index, ' ');
		}
		index++;
		text = sb.toString().replaceAll(" +","").trim();
		
	}
	return text;*/
	 return Jsoup.parse(htmlConter).text();
}
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值