数据来源
https://pan.baidu.com/s/1WSWlp9bFSf7SqYNk9wW1Zw
提取码: 6qmj
目录
01 | 项目简介
02 | 数据处理
03 | 可视化
01 | 项目简介
1.项目内容
本项目是通过app store的数据,对苹果商店app的热度、分布情况进行一个描述统计分析。
主要是手段利用python进行数据的预处理,通过power bi对结果进行可视化操作。
2.数据介绍
通过word或者excel打开数据,发现其中共有16个字段。
字段 | 对应名称 | 字段 | 对应名称 |
---|---|---|---|
id | app id | track_name | app 名称 |
size_byte | app大小 | currency | 货币类型 |
price | 售价 | ratingh_count_tot | 所有版本评价数 |
rating_count_ver | 当前版本评价数 | user_rating | 所有版本评分 |
usering_rating_ver | 当前版本评分 | ver | 最新版本 |
cont_rating | 内容评价 | prime_genre | 主要类别 |
sup_devices.num | 支持设备数目 | ipadSc_urls.num | 支持设备数目 |
lang_num | 支持语言数目 | vpp_lic | 启用基于vpp设备的许可 |
02 | 数据处理
1.概况分析——app的分布情况
2.评论数量——app评价最多,平均评分多少
3.总体分析——每个种类下评论最高的app是哪些
4.价格分析——app不同价位段分布情况
import pandas as pd
# 读取数据
data = pd.read_csv(r'D:\AppStore1.csv')