/ 显示数据维度
print("数据维度:行 %s,列: %s" % dataset.shape)
# 意思是%作为一个替代,将后面的dataset.shape字符串的返回值分别加到"行","列"后面
/ 查看数据
#查看前几项
print(dataset.head(10))
#print(dataset.head())默认返回前5行
#查看尾部几项
print(dataset.tail(10))
#print(dataset.tail())默认返回后5行
/描述性统计
print(dataset.describe())
/ 数据的属性和类型
print(dataset.dtypes)
/ 数据分布情况
print(dataset.groupby('class').size())
#groupby() --分组函数
#size() --元素个数
/数据相关性 (皮尔逊相关系数)
print(dataset.corr(method='pearson'))
/数据的分布分析 (高斯分布)
数据接近0 , 偏差最小
print(dataset.skew())