1. 背景与意义
音乐平台蕴含大量用户行为与情感表达数据,这些信息不仅可以用于推荐系统训练,还能挖掘用户兴趣、舆情分析和流行趋势预测。网易云与QQ音乐是中国主流平台,具备代表性,其数据爬取研究价值极高。
2. 项目目标与环境准备
目标:
- 获取网易云音乐的歌曲热评信息、评论者昵称、时间戳;
- 获取QQ音乐的歌手信息、歌曲热度、歌词与评论。
工具环境:
- Python 3.10+
- 第三方库:
requests
,BeautifulSoup
,selenium
,execjs
,pymysql
,pandas
,lxml
- Chrome浏览器 + ChromeDriver
安装命令:
bash
复制编辑
pip install requests beautifulsoup4 selenium execjs pymysql pandas lxml