Java获取网址HTML文本

4 篇文章 1 订阅
2 篇文章 0 订阅


public static String getWebHtml(String domain) {
	//	http://www.baidu.com
	StringBuffer sb = new StringBuffer();
	InputStream is = null;
	InputStreamReader isr = null;
	BufferedReader in = null;
	try {
		java.net.URL url = new java.net.URL(domain);
		is = url.openStream();
		isr = new InputStreamReader(is,"utf-8");
		in = new BufferedReader(isr);
		String line;
		while ((line = in.readLine()) != null) {
			sb.append(line).append("\n");
//				System.out.println(line);
		}
		in.close();
		
	} catch (IOException e) {
		e.printStackTrace();
	}finally {
		try {
			if(in!=null){
				in.close();
				in=null;
			}
			if(isr!=null){
				isr.close();
				isr=null;
			}
			if(is!=null){
				is.close();
				is=null;
			}
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
	return sb.toString();
}





Java中解析HTML文本可以使用Jsoup库。Jsoup是一个开源的Java HTML解析器,可以方便地从HTML文档中提取数据。 使用Jsoup解析HTML文本的步骤如下: 1. 导入Jsoup库:在项目中引入Jsoup库的依赖,可以通过Maven或Gradle进行引入。 2. 获取HTML文档:可以通过URL文件或字符串等方式获取HTML文档。 3. 解析HTML文档:使用Jsoup提供的API进行解析,可以根据需要提取标签、属性、文本内容等信息。 下面是一个简单的示例代码,演示了如何使用Jsoup解析HTML文本: ```java import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class HtmlParser { public static void main(String[] args) { String html = "<html><body><div><h1>标题</h1><p>段落</p></div></body></html>"; // 解析HTML文档 Document doc = Jsoup.parse(html); // 提取标题 Element titleElement = doc.select("h1").first(); String title = titleElement.text(); System.out.println("标题:" + title); // 提取段落 Elements paragraphElements = doc.select("p"); for (Element paragraphElement : paragraphElements) { String paragraph = paragraphElement.text(); System.out.println("段落:" + paragraph); } } } ``` 运行以上代码,输出结果为: ``` 标题:标题 段落:段落 ``` 这个示例演示了如何从HTML文档中提取标题和段落内容。你可以根据需要使用Jsoup提供的API进行更复杂的解析操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值