Android根据网址获取网页源码并抓取相应字段

原创 2016年06月01日 11:44:30

根据网址获取源码

/**
	 * 根据网址返回网页的源码
	 * 
	 * @param htmlUrl
	 * @return
	 */
	public String getHtmlSource(String htmlUrl) {
		URL url;
		StringBuffer sb = new StringBuffer();
		try {
			url = new URL(htmlUrl);
			BufferedReader in = new BufferedReader(new InputStreamReader(
					url.openStream(), "UTF-8"));// 读取网页全部内容
			String temp;
			while ((temp = in.readLine()) != null) {
				sb.append(temp);
			}
			in.close();
		} catch (MalformedURLException e) {

		} catch (IOException e) {
			e.printStackTrace();
		}
		return sb.toString();
	}
抓取源码中包含name字段的content内容

int start = html.lastIndexOf("<head>");
		int end = html.lastIndexOf("</head>");
		String str = (String) html.subSequence(start, end);
		List<String> list = new ArrayList<String>();
		String[] meta = str.split("<meta");
		for (String string : meta) {
			list.add(string);
		}
		for (String ss : list) {
			if (ss.contains("name")) {
				if (ss.split("\"|'|‘.*’").length > 3) {
					Toast.makeText(getApplicationContext(), ss.split("\"|'|‘.*’")[3], 1).show();
				}

			}
		}



android根据Url获取访问网页的源码

/** * 获取HTML数据 * * */ public class HtmlService { public static String getHtml(String path...
  • chunho
  • chunho
  • 2016年01月05日 11:37
  • 807

简单爬虫python实现01——获取网页源码与存储

风怒
  • w93223010
  • w93223010
  • 2014年02月07日 18:34
  • 8765

Android中如何获取网页源码?

技术点:1、通过已知的网页路径获得流 2、把流转换成字节数组 3、把字节数组转换成String字符串显示在TextView控件中 一、获得流     public static Str...
  • violet19890610
  • violet19890610
  • 2013年12月26日 16:47
  • 1637

java获取特定网页的源代码

网页抓取
  • lcr_happy
  • lcr_happy
  • 2017年06月19日 08:35
  • 246

PHP抓取网页内容获得网页源代码

1、 file_get_contents获取 $url="http://www.baidu.com/"; $fh= file_get_contents('http://www.hxfzzx.co...
  • han0207xiao
  • han0207xiao
  • 2016年08月29日 17:36
  • 6516

Android之获取WebView所加载网址网站的源码

WebView是Android上常用的组件之一,
  • stzy00
  • stzy00
  • 2014年09月02日 10:14
  • 1675

ajax获取页面源代码(xmlhttp异步的例子)

var oDiv var xh  function getXML(){ oDiv = document.all.m oDiv.innerHTML = "正在装载栏目数据,请稍侯......." oDi...
  • szsbell
  • szsbell
  • 2008年03月25日 16:00
  • 663

使用Ajax抓取远程网页源代码并抓取其中图片【老司机不须再用】

抓取输入框中的URL的源代码,并从源代码中抓取其中的所有图片或视频地址。该工具帮助你快速获取你想要的图片或视频资源。...
  • HelloWorld_In_Java
  • HelloWorld_In_Java
  • 2017年05月17日 20:43
  • 704

android获取网页数据的几种方式

Android获取网页数据并显示在TextView上面
  • jiaoleiqiang
  • jiaoleiqiang
  • 2017年11月24日 17:59
  • 219

android 获取当前webview显示的网页的源码和网页中框架的源码

如果是仅仅是为了获取网页的源代码的话,可以参考这篇文章:Android: 在WebView中获取网页源码但是,我遇到的情况是网页中套用了框架,仅仅查看网页源代码是不能得到我想要的数据的,需要获得框架的...
  • A199581
  • A199581
  • 2017年02月26日 15:41
  • 2320
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Android根据网址获取网页源码并抓取相应字段
举报原因:
原因补充:

(最多只允许输入30个字)