java 网页采集_java获得采集网页内容的方法小结

最新推荐文章于 2021-02-20 09:59:49 发布

27岁自我认知

最新推荐文章于 2021-02-20 09:59:49 发布

阅读量272

点赞数

文章标签： java 网页采集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30117665/article/details/114167006

版权

为了写一个java的采集程序，从网上学习到3种方法可以获取单个网页内容的方法，主要是运用到是java IO流方面的知识，对其不熟悉，因此写个小结。 import java.io.BufferedReader;

import java.io.ByteArrayOutputStream;

import java.io.IOException;

import java.io.InputStreamReader;

import java.net.HttpURLConnection;

import java.net.URL;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

public class Get_Html {

public static void main(String[] args) throws Exception {

long start= System.currentTimeMillis();

String str_url="http://www.hiphop8.com/city/guangdong/guangzhou.php";

Pattern p = Pattern.compile(">(13\\d{5}|15\\d{5}|18\\d{5}|147\\d{4})

//String html = get_Html_2(str_url);

//String html = get_Html_1(str_url);

String html = get_Html_3(str_url);

Matcher m = p.matcher(html);

int num = 0;

while(m.find())

{

System.out.println("打印出的号码段落："+m.group(1)+" 编号"+(++num));

}

System.out.println(num);

long end = System.currentTimeMillis();

System.out.println("花费的时间

最低0.47元/天解锁文章

27岁自我认知

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java 网页采集_java获得采集网页内容的方法小结

为了写一个java的采集程序，从网上学习到3种方法可以获取单个网页内容的方法，主要是运用到是java IO流方面的知识，对其不熟悉，因此写个小结。 import java.io.BufferedReader;import java.io.ByteArrayOutputStream;import java.io.IOException;import java.io.InputStreamReade...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。