写在前面
而后能够进入今天的正文git
1、描述性统计分析
Excel里能够用【数据分析】功能里的【描述统计】功能来查看数据集经常使用的统计指标,但这里只能是对数值型的数据进行统计。
ide
pandas里能够用describe方法对整个数据集作一个描述性统计分析,固然这里也只是对数值型数据才能够出结果,非数值型数据不在统计范围内。函数
# 描述性统计分析
df_list.describe()
获得结果以下,能够看到count(计数)、mean(均值)、std(标准差)、min(最小值)、max(最大值)、25%、50%、75%分别表示3/4位数、中位数和1/4位数。
工具
行列转置
因为字段太多了,因此这里能够转置一下,方便查看,用.T转置spa
# 行列转置
df_list.describe().T
结果如图,更符合一个表格的习惯,能够看到可以被统计出来的只有数值型数据,字符型的数据是统计不出来的。