省略号的问题
import numpy as np
import pandas as pd
pd.set_option('display.max_columns',1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth',1000)
numpy.set_printoptions(threshold=numpy.nan)
单因子探索分析与数据可视化
集中趋势: 均值、中位数、众数、分位数
离中趋势: 标准差、方差
偏态系数: 平均值偏离状态(中位数)的一种衡量
峰态系数: 数据分布集中强度的衡量,越大顶部越尖
数据分类
定类(类别): 根据事务离散、无差别属性进行的分类
定序(顺序): 可以界定数据的大小,但不能测定差值
定距(间隔): 可以界定数据大小的同时,可测定差值,但无绝对零点
定比(比率): 可以界定数据大小,可测定差值,有绝对零点