java爬取网易云歌单_Java爬取网易云音乐所有歌曲一:爬取所有歌手及其对应id...

本文展示了如何使用Java的Jsoup库爬取网易云音乐网站上的歌手信息。通过循环遍历不同类型的歌手分类和英文名称,构建URL并发送HTTP请求,解析HTML获取歌手名字和对应的ID,然后将数据保存到文件中。
摘要由CSDN通过智能技术生成

package com.ssm.jsoup.music;

import com.ssm.utils.FileUtils;

import org.jsoup.Connection;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

import java.io.IOException;

/**

* describe:

*

* @author wfd

* @date 2019/08/27

*/

public class WyySinger {

public static void main(String[] args) {

int[] type = {1001, 1002, 1003, 2001, 2002, 2003, 6001, 6002, 6003, 7001, 7002, 7003, 4001, 4002, 4003};

int[] enName = {-1, 0, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79,

80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90};

for (int i = 0; i < type.length; i++) {

for (int j = 0; j < enName.length; j++) {

String url = "https://music.163.com/discover/artist/cat?id=" + type[i] + "&initial=" + enName[j] + "";

getData(url);

}

}

}

public static void getData(String url) {

System.out.println(url);

Document doc = null;

try {

doc = Jsoup.connect(url).userAgent("Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36")

.header("Accept", "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3")

.header("Accept-Encoding", "gzip, deflate, br")

.header("Accept-Language", "zh-CN,zh;q=0.9,en;q=0.8")

.header("Cookie", "ntes_nnid=6c5b87bd25a17a9fd9692580e5c94f78,1565912650142; _ntes_nuid=6c5b87bd25a17a9fd9692580e5c94f78; _iuqxldmzr_=32; WM_TID=LDdg6Rcj9ENEBRFUUFc4pPF4%2B6vTAn2G; WM_NI=R9FV8%2B3KZYFzFTyT7isTQivbb2VLf%2FzcQWAi%2BQdwZbxir0FYRR17q5zGEaYaTxwuyNrXXwr8kuNyRC2wcdeCeCAMWeyd1e8YJR%2FyJPg1kc3dMwiiFWuGVyQtxssnI3kBT04%3D; WM_NIKE=9ca17ae2e6ffcda170e2e6eed1cf4eacb8bb8ac641899e8fb3c85b928f8e84f333a7939790c14f8a90fdd3d92af0fea7c3b92a92e78ab7bb21f19596bac572868cb7b5b663b18c9f8af56aa2ee9aade525babd9fb8c463e98fac98d96abcb7bed1c553928effd8f43fba998b82dc6b98a8b996fc46b2889898f134a9ab829ad149f2a9ad85e849a79d8faed66fbbbcff86bb538a8ee19ac95ca5efa584b2708fa9a78ac55db7999a9ad480bcadbd8fcc39a99e9cd1b737e2a3; JSESSIONID-WYYY=yBXBK%2FIFCVHGtcBTi3%5CSUeDQMvfzApFAMBZzlZ%2BENNt7n2f9j2SCTvBRQpFACIc5EnGK3%2BtFhTQJWOhtCkJvHZ8olJ83RYG8Exukhj6Ftzw%2FBwylje03bjPW4Vl9IXXOHeNIRWxO4%2BKndGOJ0HjhnNZJtoESJht8PfF%2FfzAVXh6kOWiq%3A1566909226292")

.header("Referer", "https://music.163.com/discover/artist/cat?id=1001&initial=65")

.header("Upgrade-Insecure-Requests", "1")

.method(Connection.Method.GET)

.timeout(200000).get(); // 设置请求头等信息,模拟人工访问,超时时间可自行设置

Elements names = doc.select("#m-artist-box li a.s-fc0");

for (Element element : names) {

String mess = "{\"name\":" + "\"" + element.text() + "\"," +

"\"uid\":" + "\"" + element.attr("href").

replace("/artist?id=", "").trim() + "\"}";

System.out.println(mess);

FileUtils.saveConToFile(mess, "g://singer.json"); // 可自行写存储信息的代码

}

} catch (IOException e) {

e.printStackTrace();

}

}

}

复制代码

爬取网易云音乐,需要先了解其接口。网易云音乐的接口文档可以在其官方网站上找到,其中包括了歌曲歌手、专辑、排行榜等数据的接口。 接下来,你可以使用Java的HttpURLConnection或者HttpClient等类库,发送HTTP请求,获取数据。例如,你可以使用以下代码获取网易云音乐热门歌曲: ```java import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; public class NetEaseMusicCrawler { public static void main(String[] args) { try { // 设置请求URL URL url = new URL("https://music.163.com/api/playlist/detail?id=3779629"); // 打开连接 HttpURLConnection connection = (HttpURLConnection) url.openConnection(); // 设置请求方式 connection.setRequestMethod("GET"); // 获取响应结果 BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream(), "UTF-8")); String line; StringBuilder result = new StringBuilder(); while ((line = reader.readLine()) != null) { result.append(line); } reader.close(); // 输出结果 System.out.println(result.toString()); } catch (Exception e) { e.printStackTrace(); } } } ``` 上述代码中,我们通过URL访问网易云音乐的热门歌曲接口,并使用HttpURLConnection发送GET请求。最后,我们将响应结果输出到控制台。 注意,为了避免被封IP,爬取数据时需要设置合理的请求间隔时间,并且不要过于频繁地请求同一个接口。另外,需要注意网易云音乐的接口可能会随时更新,需要及时更新代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值