android 抓取http,Android: 获取HTTP页面并对它的进行抓取_http_开发99编程知识库

HTML頁面的格式是有效的,如果你想解析內容,就可以使用 XPath,但是如果HTML是醜陋的HTML,你就需要修復它,尋找你想要的東西,尋找你想要的內容。 我有一個 Android 應用,它必須解析一些真正的錯誤,然後通過char查找圖像並找到圖像對象。

因此在你的代碼中,你可以使用 read:rd.read();

而不是 readLine,然後看看每個字元。 使用( 意思是 if/else 等等 ) 和 正規表達式 來定位內容需要很多條件,但它是可能

編輯

啊,儘管如這裡,我應該添加如何在那之後獲得圖像。 因此,一旦你擁有了圖像的URL,就像這樣:Bitmap retImg;

...

HttpGet get = new HttpGet(imgURLStr);

HttpConnectionParams.setConnectionTimeout(get.getParams(),

CONNECTION_TIMEOUT_MS);

HttpConnectionParams.setSoTimeout(get.getParams(),

SOCKET_TIMEOUT_MS);

HttpResponse response;

try {

response = httpClient.execute(get);

} catch (ClientProtocolException e) {

Log.e(TAG, e.getMessage(), e);

throw new IOException("Invalid protocol.");

}

if (response.getStatusLine().getStatusCode()!= 200) {

throw new IOException("Bad response:" +

response.getStatusLine().getStatusCode());

}

HttpEntity entity = response.getEntity();

BufferedInputStream bis = new BufferedInputStream(entity.getContent(),

8 * 1024);

retImg = BitmapFactory.decodeStream(bis);

bis.close();

然後這個方法來自於返回的圖像( retImg ),它被緩存在設備上的資料庫中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值