一、项目背景与目标
随着线下演唱会的重新火爆,演唱会门票价格和销售情况逐渐成为舆论焦点。我们希望通过构建一个爬虫系统,抓取主流票务平台(如大麦网、猫眼演出等)上的演唱会门票信息,并进行数据分析,以洞察:
- 哪些歌手/组合最热门?
- 哪些城市演唱会最密集?
- 票价结构如何分布?
- 哪些场次售罄最为迅速?
📌目标内容包括:
- 城市
- 场馆
- 歌手/演出名称
- 日期与时间
- 票价等级及价格
- 销售状态(在售、售罄、预售)
二、分析目标网站结构
我们以大麦网为例(**https://www.damai.cn/**)。初步打开网页后,你会发现页面动态渲染较多,直接用 requests
获取 HTML 后几乎拿不到有效数据。
解决思路包括:
- 观察是否有 JSON API 提供演出信息(XHR请求)
- 抓包识别真实数据接口
- 使用浏览器 DevTools → Ne