网站的轮播图的获取

获取某网站的轮播图

/**
     * 获取轮播图
     * 
     * @author Michael
     * @param newsUrl
     * @return
     */

    public List<Map<String, String>> crawler4Pic(String newsUrl) {
        List<Map<String, String>> picList = new ArrayList<Map<String, String>>();
        try {
            Document newsPageDoc = Jsoup.connect(newsUrl)
                    .header("Content-Type", "text/html; charset=GB2312")
                    .header("Accept-Language", "zh-CN,zh;q=0.8").timeout(3000)
                    .get(); // 获得当前页面的Dom
            String picString = newsPageDoc.select("script").eq(5).toString()
                    .split("var data = ")[1].split(";")[0];
            JSONArray picArray = JSONArray.fromObject(picString);
            for (int i = 0; i < picArray.size(); i++) {
                Map<String, String> picMap = new HashMap<String, String>();
                String picUrl = picArray.getString(i).split("\"")[3];
                String titleUrl = picArray.getString(i).split("\"")[7] + ":"
                        + picArray.getString(i).split("\"")[11];
                picMap.put("picUrl", picUrl);
                picMap.put("title", titleUrl);
                picList.add(picMap);
                System.out.println("picUrl: " + picUrl + "   title:  "
                        + titleUrl);
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        // System.out.println("picList =" + picList);
        return picList;
    }
    /**
     * @param args
     */
    public static void main(String[] args) {
        BBMCCrowler bbmc = new BBMCCrowler();
        bbmc.crawler4Pic("http://www.bbmc.edu.cn/");
    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值