基于大数据的音乐数据分析可视化系统 ✅计算机毕业设计✅

最新推荐文章于 2024-07-24 17:33:05 发布

q_3548885153

最新推荐文章于 2024-07-24 17:33:05 发布

阅读量154

点赞数

分类专栏： biyesheji0001 biyesheji0002 毕业设计文章标签：大数据数据分析课程设计毕业设计 python flask 数据挖掘

本文链接：https://blog.csdn.net/q_3548885153/article/details/134974095

版权

biyesheji0001 同时被 3 个专栏收录

88 篇文章 60 订阅

订阅专栏

biyesheji0002

88 篇文章 10 订阅

订阅专栏

毕业设计

88 篇文章 34 订阅

订阅专栏

毕业设计：2023-2024年计算机专业毕业设计选题汇总（建议收藏）

毕业设计：2023-2024年最新最全计算机专业毕设选题推荐汇总

🍅感兴趣的可以先收藏起来，点赞、关注不迷路，大家在毕设选题，项目以及论文编写等相关问题都可以给我留言咨询，希望帮助同学们顺利毕业。🍅

1、项目简述

后端：Flask、PyMySql、pandas、requests、bs4
前端：HTML、Jquery、Ajax、LayUI、Echarts

2、项目模块

本项目主要采用了Python的request库、bs4库实现了网易云歌单数据的采集，然后使用pymysql将数据保存到MySQL数据库中。在数据清洗和处理方面，采用了Pandas等库来进行数据清洗和处理，从而得到干净、规范的数据。

在这里插入图片描述
在可视化分析方面，采用了Echarts技术实现歌单创建省份数量中国地图、最受欢迎的歌单类型TOP7，歌单分享量和评论数变化，歌单歌曲数量范围，最受欢迎的歌单TOP5、歌单收藏量变化、语种类型歌单播放量等多种分析图表，使得数据更加直观、易于理解。
在后台数据管理方面，采用了Layui技术实现了用户登陆注册、用户管理、公告管理以及歌单数据管理等多种功能，方便管理员对数据进行管理和维护。

3、项目界面

1、音乐可视化大屏

在这里插入图片描述

2、歌曲管理界面
在这里插入图片描述

3、注册登录界面

在这里插入图片描述

4、后台首页

在这里插入图片描述

5、数据采集爬虫界面

在这里插入图片描述

4、项目说明

本项目实现了以下主要功能：
网易云歌单数据的采集和处理，包括歌单基本信息、歌曲列表、评论数、分享量、创建时间等多种数据。
将数据保存到MySQL数据库中，以便后续进行数据分析和管理。
实现了数据可视化分析功能，包括歌单创建省份数量中国地图、最受欢迎的歌单类型TOP7，歌单分享量和评论数变化，歌单歌曲数量范围，最受欢迎的歌单TOP5、歌单收藏量变化、语种类型歌单播放量等多种分析图表。
实现了后台数据管理功能，包括用户登陆注册、用户管理、公告管理以及歌单数据管理等多种功能。

运行环境：推荐Python3.6及以上，推荐python3.7；
开发工具：PyChram（推荐）；
操作系统：windows 10 8G内存以上（其他windows以及macOS支持，但不推荐）；
浏览器：Firefox(推荐)、Google Chrome(推荐)、Edge;
数据库：MySQL8.0(推荐)及其他版本（支持，但容易异常尤其MySQL5.7（不含）以下版本）；
数据库可视化工具：Navicat Premium 15（推荐）以及其他Navicat版本

随着互联网技术的发展，音乐成为了人们生活中不可或缺的一部分，而网易云音乐作为国内最受欢迎的音乐平台之一，积累了大量的用户和歌单数据。针对这些数据，开发者们可以进行各种分析和挖掘，从而更好地理解用户需求和市场趋势。
本项目就是基于这个背景而设计的，旨在通过Python技术实现对网易云音乐热门歌单数据的采集、清洗、处理和可视化分析，并将结果保存到MySQL数据库中，最终通过Flask构建的数据服务接口实现数据的展示和管理。

5、部分代码




# 歌单管理页面
@app.route('/html/music')
def music_manager():
    return render_template('html/music.html')


# 获取歌单数据分页
@app.route('/music/list', methods=["POST"])
def music_list():
    get_data = request.form.to_dict()
    page_size = get_data.get('page_size')
    page_no = get_data.get('page_no')
    param = get_data.get('param')
    data, count, page_list, max_page = music_service.get_musiclist_list(int(page_size), int(page_no), param)
    return jsonify({"data": data, "count": count, "page_no": page_no, "page_list": page_list, "max_page": max_page})


# 添加歌单数据
@app.route('/music/add', methods=["POST"])
def music_add():
    get_data = request.form.to_dict()
    name = get_data.get('name')
    type = get_data.get('type')
    tags = get_data.get('tags')
    create_time = get_data.get('create_time')
    tracks_num = get_data.get('tracks_num')
    play_count = get_data.get('play_count')
    subscribed_count = get_data.get('subscribed_count')
    share_count = get_data.get('share_count')
    comment_count = get_data.get('comment_count')
    nickname = get_data.get('nickname')
    gender = get_data.get('gender')
    province = get_data.get('province')
    return music_service.add_musiclist(name, type, tags, create_time, tracks_num, play_count, subscribed_count,
                                       share_count,
                                       comment_count, nickname, gender, province)


# 修改歌单数据
@app.route('/music/edit', methods=["PUT"])
def music_edit():
    get_data = request.form.to_dict()
    id = get_data.get('id')
    name = get_data.get('name')
    type = get_data.get('type')
    tags = get_data.get('tags')
    tracks_num = get_data.get('tracks_num')
    play_count = get_data.get('play_count')
    subscribed_count = get_data.get('subscribed_count')
    share_count = get_data.get('share_count')
    comment_count = get_data.get('comment_count')
    nickname = get_data.get('nickname')
    gender = get_data.get('gender')
    province = get_data.get('province')
    music_service.edit_musiclist(id, name, type, tags, tracks_num, play_count, subscribed_count, share_count,
                                 comment_count, nickname, gender, province);
    return '200'


# 删除歌单数据
@app.route('/music/delete', methods=["DELETE"])
def music_delete():
    get_data = request.form.to_dict()
    id = get_data.get('id')
    music_service.del_user(id)
    return '200'


# -----------------歌单但管理模块END-----------------

"""最受欢迎的歌单类型"""


@app.route('/get_hot_type')
def get_hot_type():
    hot_type_df = df[['type', 'play_count']].groupby(df['type']).sum().sort_values('play_count',
                                                                                   ascending=False).reset_index()
    hot_type_top7 = hot_type_df.head(7)
    playlist_type = hot_type_top7['type'].tolist()
    play_count = hot_type_top7['play_count'].tolist()

    return json.dumps({'playlist_type': playlist_type, 'play_count': play_count}, ensure_ascii=False)


"""最受欢迎的歌单"""


@app.route('/get_hot_playlist')
def get_hot_playlist():
    hot_playlist_df = df[['name', 'play_count']].sort_values('play_count', ascending=False).reset_index()
    hot_playlist_top5 = hot_playlist_df.head(5)
    playlist_name = hot_playlist_top5['name'].tolist()
    play_count = hot_playlist_top5['play_count'].tolist()
    return json.dumps({'playlist_name': playlist_name, 'play_count': play_count}, ensure_ascii=False)


"""歌单数据随月份变化"""


@app.route('/get_month_data')
def get_month_data():
    yearList = []

    # 获取当前日期和时间
    current_date = datetime.datetime.now()
    # 获取今年年份
    this_year = current_date.year
    # 获取去年年份
    last_year = this_year - 1
    for year in [last_year, this_year]:
        year = str(year)
        yearList.append({
            "year": year,
            "data": [
                df[df['create_time'].str[:4] == year].groupby(df['create_time'].str[5:7]).sum().reset_index()[
                    'share_count'].tolist(),
                df[df['create_time'].str[:4] == year].groupby(df['create_time'].str[5:7]).sum().reset_index()[
                    'comment_count'].tolist()
            ]
        })
    month = df[df['create_time'].str[:4] == str(this_year)].groupby(df['create_time'].str[5:7]).sum().reset_index()[
        'create_time'].tolist()
    yearData = {
        "yearData": yearList,
        "monthList": [str(int(x)) + '月' for x in month]
    }

    return json.dumps(yearData, ensure_ascii=False)


"""歌单数据随天数变化"""


@app.route('/get_day_data')
def get_day_data():
    non_vip_df = df[df['vip_type'] == '0'].groupby(df['create_time'].str[8:10]).sum().reset_index()[
        ['create_time', 'subscribed_count']]
    vip_df = \
        df[(df['vip_type'] == '10') | (df['vip_type'] == '11')].groupby(
            df['create_time'].str[8:10]).sum().reset_index()[
            ['create_time', 'subscribed_count']]
    vip_type_df = pd.merge(non_vip_df, vip_df, left_on='create_time', right_on='create_time', how='inner')

    sub_data = {
        "day": [str(int(x)) for x in vip_type_df["create_time"].tolist()],
        "vip": vip_type_df["subscribed_count_y"].tolist(),
        "nonvip": vip_type_df["subscribed_count_x"].tolist(),

    }

    return json.dumps(sub_data, ensure_ascii=False)


"""歌单歌曲数量分布"""


@app.route('/get_track_data')
def get_track_data():
    bins = [0, 50, 150, 500, 100000]
    cuts = pd.cut(df['tracks_num'], bins=bins, right=False, include_lowest=True)
    data_count = cuts.value_counts()
    data = dict(zip([str(x) for x in data_count.index.tolist()], data_count.tolist()))
    map_data = [{'name': name, 'value': value} for name, value in data.items()]
    track_value = {'t_v': map_data}

    return json.dumps(track_value, ensure_ascii=False)


"""语种类型歌单播放量"""


@app.route('/get_type_data')
def get_type_data():
    playlist_type_df = df[['type', 'play_count']].groupby(df['type']).sum()
    playlist_type_df = playlist_type_df.loc[['华语', '欧美', '日语', '韩语', '粤语'], :]
    data = dict(zip(playlist_type_df.index.tolist(), playlist_type_df['play_count'].tolist()))
    map_data = [{'name': name, 'value': value} for name, value in data.items()]
    type_sum = {'t_s': map_data}

    return json.dumps(type_sum, ensure_ascii=False)


def replace_str(x):
    rep_list = ['省', '市', '维吾尔', '自治区', '壮族', '回族', '维吾尔族', '特别行政区']
    for rep in rep_list:
        x = re.sub(rep, '', x)  # 利用正则表达式实现替换处理
    return x


def add_province(df_data, province):
    # 所有年份
    years = df_data['create_time'].drop_duplicates().tolist()
    for year in years:
        # 每年的省份
        new_province = df_data.loc[df_data['create_time'] == year, :]['province'].drop_duplicates().tolist()
        # 缺失的省份 = 所有省份 - 每年的省份
        rest_province = [x for x in province if x not in new_province]
        # 对缺失的省份生成一个DataFrame，填充0值，并与原DataFrame合并
        if len(rest_province):
            rest_df = pd.DataFrame([[year, x, 0] for x in rest_province], columns=df_data.columns)
            df_data = pd.concat([df_data, rest_df], ignore_index=True)

    return df_data


"""动态地图"""


@app.route('/get_map_data')
def get_map_data():
    time_df = df.groupby([df['create_time'].str[:4], df['province'].apply(replace_str)])
    time_df = time_df['play_count'].count().reset_index()
    re_time_df = time_df[time_df['province'] != '海外']
    province = re_time_df['province'].drop_duplicates().tolist()

    re_time_df2 = add_province(re_time_df, province)

    final_time_df = re_time_df2.sort_values(by=['create_time', 'province']).reset_index(drop=True)
    final_province = final_time_df['province'].drop_duplicates().tolist()
    final_year = final_time_df['create_time'].drop_duplicates().tolist()

    playlist_num = []
    for year in final_year:
        playlist_num.append(final_time_df.loc[final_time_df['create_time'] == year, 'play_count'].tolist())

    playlist_data = {"year": final_year, "province": final_province, "playlist_num": playlist_num}

    return json.dumps(playlist_data, ensure_ascii=False)


@app.route('/')
def index():
    gender_df = df[['gender']].groupby(df['gender']).count()
    gender_data = {'男': gender_df.loc['男', 'gender'], '女': gender_df.loc['女', 'gender']}

    return render_template('index.html', gender_data=gender_data)


if __name__ == "__main__":
    app.run()