import java.io.ByteArrayOutputStream; import java.io.InputStream; import java.net.URL; import java.net.URLConnection; public class URLSource { //获取网页标题 public static String getTitleName(String url) { String source="";//存储网页源文件 source = getSource(url); //抽取每个网页的正文内容 int c = source.indexOf("
"); int d = source.indexOf(""); String titleName=source.substring(c+7,d); return titleName; } //获取微博名称 public static String getWeiboName(String url) { String titleName=getTitleName(url); //抽取每个网页的正文内容 int c = titleName.indexOf("的微博"); String weiBoName=titleName.substring(0,c); return weiBoName; } //抽取网页的源文件 private static String getSource(String link) { String charset = "GBK";//网页默认编码设置为GBK URLConnection connection = null; try { URL url = new URL(link); //打开连接 connection = url.openConnection(); //如果网页无法打开 if(null == connection)java 获取网页标题_java 获得网页源码 获得标题信息
最新推荐文章于 2022-06-02 22:19:50 发布