Android网页爬虫

最新推荐文章于 2021-05-26 16:34:51 发布

王英豪

最新推荐文章于 2021-05-26 16:34:51 发布

阅读量6.2k

点赞数

分类专栏： Android 文章标签：爬虫 android Jsoup phantomjs

本文链接：https://blog.csdn.net/yhaolpz/article/details/60087849

版权

爬取静态页面

需求：获取本人博客页面的 title “yhao的博客- 博客频道 - CSDN.NET”

首先通过okhttp以get方式请求页面：

 final String url = "http://blog.csdn.net/yhaolpz?viewmode=contents";
        Request request = new Request.Builder().url(url).build();
        mOkHttpClient.newCall(request).enqueue(new Callback() {
            @Override
            public void onFailure(Call call, IOException e) {
                Log.e(TAG, "onFailure ");
            }

            @Override
            public void onResponse(Call call, Response response) throws IOException {
                if (response.code() == 200) {
                    String html = response.body().string();
                    Log.d(TAG, "onResponse: " + html);                 
                }
            }
        });

返回页面数据onResponse如下：

 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
 <html xmlns="http://www.w3.org/1999/xhtml">                                                                  
 <head>  
 <script type="text/javascript" src="http://c.csdnimg.cn/pubfooter/js/tracking.js"

最低0.47元/天解锁文章

王英豪

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
3
评论
Android网页爬虫

静态页面需求：获取http://blog.csdn.net/yhaolpz?viewmode=contents页面的title首先通过okhttp以get方式请求页面： final String url = "http://blog.csdn.net/yhaolpz?viewmode=contents"; Request request = new Request.B
复制链接

扫一扫

专栏目录