Android根据网址获取网页源码并抓取相应字段

原创 2016年06月01日 11:44:30

根据网址获取源码

/**
	 * 根据网址返回网页的源码
	 * 
	 * @param htmlUrl
	 * @return
	 */
	public String getHtmlSource(String htmlUrl) {
		URL url;
		StringBuffer sb = new StringBuffer();
		try {
			url = new URL(htmlUrl);
			BufferedReader in = new BufferedReader(new InputStreamReader(
					url.openStream(), "UTF-8"));// 读取网页全部内容
			String temp;
			while ((temp = in.readLine()) != null) {
				sb.append(temp);
			}
			in.close();
		} catch (MalformedURLException e) {

		} catch (IOException e) {
			e.printStackTrace();
		}
		return sb.toString();
	}
抓取源码中包含name字段的content内容

int start = html.lastIndexOf("<head>");
		int end = html.lastIndexOf("</head>");
		String str = (String) html.subSequence(start, end);
		List<String> list = new ArrayList<String>();
		String[] meta = str.split("<meta");
		for (String string : meta) {
			list.add(string);
		}
		for (String ss : list) {
			if (ss.contains("name")) {
				if (ss.split("\"|'|‘.*’").length > 3) {
					Toast.makeText(getApplicationContext(), ss.split("\"|'|‘.*’")[3], 1).show();
				}

			}
		}



版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

Android中实现地址栏输入网址能浏览该地址网页源码操作访问网络

首先实现简单布局: <EditText android:id="@+id/et_url" android:layout_width="wrap_content" ...
  • chrp99
  • chrp99
  • 2013-06-14 15:11
  • 2470

根据网址获取网页源码(1)

java根据网址获取网页源码:有两种方法: 这两种方法都只能获取一般网站的源码,对于需要登录,验证,需要证书的网站不行 但是对于get数据传输的的网址,根据get传输数据的特点,所以可以将传入的数据放...

android 源码编译时make出错,对照相应的问题修改

如果编译源码出错,则可以打入以下代码,最好重启过后重新编译  sudo apt-get install git-core gnupg flex bison gperf build-essential...

Android下载源码,编译等的官网说明网址

http://source.android.com/source/building.html网上看了那么多的blog说明,终于找到原版了,哈哈!

Android网络:HTTP之利用HttpURLConnection访问网页、获取网络图片实例 (附源码)

前文所示的TCP局域网传送东西,除了对传输层的TCP/UDP支持良好外,Android对HTTP(超文本传输协议)也提供了很好的支持,这里包括两种接口: 1、标准Java接口(java.net)...

Android网络:HTTP之利用HttpURLConnection访问网页、获取网络图片实例 (附源码)

如前文所示的TCP局域网传送东西,除了对传输层的TCP/UDP支持良好外,Android对HTTP(超文本传输协议)也提供了很好的支持,这里包括两种接口:1、标准Java接口(java.net) --...

android系列: 在WebView中获取网页源码

转载学习。。。。

Android: 在WebView中获取网页源码

1. 使能javascript:  ? 1 webView.getSettings().setJavaScriptEnabled(true);...

Android: 在WebView中获取网页源码

1. 使能javascript:  ? 1 webView.getSettings().setJavaScriptEnabled(true);...

Android: 在WebView中获取网页源码

1. 使能javascript:  ? 1 webView.getSettings().setJavaScriptEnabled(true);...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)