高维数据可视化
数据的维度:数据包含的属性的数量。
多维度数据:拥有多个属性的数据。
三维数据局限性:
1、屏幕是二维的、三维散点图的点与点之间会遮挡;
2、从不同三维视角观察数据点会得到不同的分布。
高维数据:维度大于等于2的数据。
**高维数据在日常生活中的应用:**医疗数据、城市数据、体育数据、、、
高维数据变换
高维数据变换——降维
方法:使用线性或非线性变换将高维数据投影到较低维子空间。
线性方法:主成分分析;多维度分析
非线性方法:等度量映射;局部线性嵌入
优点:消除冗余;减少被处理的数量;数据呈现方便。
缺点:数据丢失
应用:数据可视化;数据挖掘;模式识别
散点图矩阵
每个散点图所表示的数据是高维数据的两个属性;
n维数据的散点图矩阵包括n乘n个图表;
对角线上放对应属性值得分布图。
散点图矩阵可以表现出属性之间的相关关系。
二维散点图的数量和维度的平方成一定比例。
平行坐标轴
坐标轴与平行坐标轴
平行坐标轴可以反映出属性间的相关关系。
但是对非相邻属性之间的关系的表现相对较弱。
基于图标的方法
特点
1、用图标表达多元数据对象
2、不同图标元素表示不同属性
3、星形图、切尔诺夫脸谱图
关键点
1、选择易于被感知的视觉元素
2、映射必须直观易懂
像素图
1、充分利用屏幕空间
2、每个像素点都表示数据点
3、利用密集、不同颜色像素表示数据
特点:效果极大依赖于颜色的使用
马赛克图
优点:展现数据不同类别不断细分下的分布规律
缺点:不能把详细的数据点可视化出来