Python数据挖掘——数据概述 数据集由数据对象组成;数据的基本统计描述 中心趋势度量 均值中位数众数中列数 数据集的最大值和最小值的平均 度量数据分布 极差 最大值与最小值的差 四分位数方差四分位数极差 数据基本统计描述的图形显示 一元分布 分位数图分位数-分位数图(q-q图)直方图 二元分布 散点图 数据可视化 1、基于像素的可视化技术2、几何投影可视化技术3、基于图符的可视化技术4、层次可视化技术 度量数据的相似性和相异性 相似 和相异 都称 邻近性如果不相似,则称 相似性度量为0