1. 对google play store的app数据分析
从网上爬取谷歌商店数据并进行数据分析
分析步骤:
1.数据清洗(脏数据),数据处理(异常值,非结构化数据转换为结构化数据)
2.数据分析 使用pandas提取指定数据进行分析,并使用matplotlib绘图。
最后介绍了pandas_profiling,一种实用的数据报表生成方法。
1.数据清洗
1.读取并简单查看数据
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
#Genres内容分级
#加载文件
#分析'App', 'Category', 'Rating', 'Reviews', 'Size', 'Installs', 'Type'
df = pd.read_csv('./googleplaystore.csv', usecols=(0, 1, 2, 3, 4, 5, 6))
df.head()
df.describe()