爬虫抓取网易云音乐民谣歌单,收听量排行

今天花了一点时间抓取了网易云音乐的热门民谣歌单,共1500热门民谣歌单,后续有时间会爬取其他分类。文末有源代码下载。

下面记录一下过程。


爬虫过程

1.首先抓取各个歌单的url与标题

public static void DoPachong( String url_str, String charset) throws ClientProtocolException, IOException{
            HttpClient hc = new DefaultHttpClient();
            HttpGet hg = new HttpGet(url_str);
            HttpResponse response = hc.execute(hg);
            HttpEntity entity = response.getEntity();


            InputStream htm_in = null;

            if(entity != null){
                htm_in = entity.getContent();
                String htm_str = InputStream2String(htm_in,charset);
                Document  doc =  Jsoup.parse(htm_str);
                Elements links= doc.select("div[class=g-bd]").select("div[class=g-wrap p-pl f-pr]").select("ul[class=m-cvrlst f-cb]").select("div[class=u-cover u-cover-1");
                for (Element link : links) {
                        Elements lin = link.select("a");  
                        String re_url = lin.attr("href");
                        String re_title = lin.attr("title");
                        re_url = "http://music.163.com"+re_url;
                        System.out.print(re_title+"       ");
                        System.out.print(re_url+"       ");
                        SecondPaChong(re_url,charset);
                }
            }
    }

2.根据抓取的url进一步用jsoup解析收听量

    public static void SecondPaChong( String url_str, String charset) throws ClientProtocolException, IOException{
        HttpClient hc = new DefaultHttpClient();
        HttpGet hg = new HttpGet(url_str);
        HttpResponse response = hc.execute(hg);
        HttpEntity entity = response.getEntity();

        InputStream htm_in = null;

        if(entity != null){
            htm_in = entity.getContent();
            String htm_str = InputStream2String(htm_in,charset);
            Document  doc =  Jsoup.parse(htm_str);
            String links= doc.select("div[class=u-title u-title-1 f-cb]").select("div[class=more s-fc3]").select("strong").text();
            System.out.println(links);

        }
}

爬取结果

这里写图片描述


民谣歌单收听量前10:

  1. 如果你想听民谣,可以从这些歌曲开始。 收听量:11548417

  2. 民谣是最安静的角落 收听量:10727168

  3. 孤独旅人配民谣。 收听量:9946952

  4. 你若听过他的歌,此生便有了挂念 收听量:7551374

  5. ♬女生嘛,污一点才可爱 收听量:6260712

  6. 阅尽沧桑,洗却铅华:聆听那些沧桑之声 收听量:5793889

  7. 民谣,成长中的情绪共谋者 收听量:5368672

  8. 华语女声‖那些入耳入心的代表曲 收听量:4535668

  9. 啤酒邂逅音乐之华语摇滚 收听量:4449337

  10. 中国民谣精选集 收听量:4423420


源码

源代码下载地址:网易云音乐歌单爬虫(给个fork啊2333)

  • 5
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值