分析目的:通过分析,了解谷歌应用商店app的总体情况。
- 加载数据, 使用 head 方法查看前5条数据, 初步浏览数据基本内容。
- 使用 describe 和 info 方法看下数据的大概分布情况。
- 数据清洗
# 重复值,空值
df[df['App'].duplicated()] # app名字重复值
df[df.duplicated()] # 完全重复的,需要最后删除
df[df.Type.isnull()] # 有个null值,需要其他文件数据校对
# 异常值
df['Category'].value_counts(dropna=False)
df[df['Category']=='1.9']
df.drop(index=10472,inplace