数据可视化:
1:基本的可视化图表分别应用了哪些视觉通道?
定量型:位置、长度、深度、颜色亮度、饱和度、面积、体积、曲率等。
定性型:空间区域、颜色色调、运动动作、几何形状等。
基本图标包含的视觉通道:
柱形图:应用的视觉通道有位置、柱子的高度
堆叠柱状图:应用的视觉通道有高度、面积
折线图:应用的视觉通道有方向
饼图;应用的视觉通道有角度、颜色色调
走势图:应用的视觉通道有颜色、方向
散点图;应用的视觉通道有位置、颜色、尺寸
2:可视化编码的时候需要注意哪些问题?
-
精准性:描述了人们从可视化中获取信息结果和原始数据的吻合程度,位置的视觉通道精准性最高 不适用亮度这种
-
可辨认性:在给定范围内,选择合适数目的不同取值,使得人们能够轻易地区分这些不同的数值 不使用宽度
-
可分离性:在表达数据的时候,不同视觉通道之间的干扰问题 尺寸影响大
-
视觉突出:人们可以依靠本能的感知能力,在很短时间内发掘和其他所有对象都不相同的对象。 优先用颜色
3:除了标记和颜色外,还有哪些帮助提升表现力和有效性的方法?
提升表现力和有效性:标记、颜色、聚焦、均衡、简单、隐喻等
聚焦:通过恰当的技术手段就将可视化结果中的最重要的部分重点突出。
均衡:空间布局要合理,将重要的元素位于中心区域,其余元素均衡分布。
简单:元素尽量简单,避免画面过于复杂。
隐喻:尽量用人们所熟悉的某样事物去表达信息,从而使得可视化内容更加直观、易懂。
数据:
1:什么是大数据“垃圾进,垃圾出”?请简要说明为什么存在脏数据,以及这些脏数据对数据分析的影响。
这句话的意思是:用胡乱选择的垃圾数据作样本,产生的研究结果自然也没有任何意义。 由于海量的数据在未清理和筛选前拥有所谓的海量这一特点,这就注定了其中的数据有极大一部分并非我们所需要的,因此大部分内容都是无效内容,因此有了这句话,也有了所谓的脏数据。这些脏数据会使得数据分析结果产生误差,甚至是无效的数据分析结果
2:把统计结果用可视化呈现出来的意义是什么?
可视化数据分析是提供了更简单直观的方法得到一些规律,这些规律还是要由人来理解判断并得到进一步有用的结论,人们通过异常点或者规律来判断数据呈现的结论,对于不同数据之间展示的关系也是需要人为去选择的。 统计结果用可视化呈现出来能更直观深入了解数据的价值,更容易分析数据所隐藏的人眼不易发现的问题 数据可视化技术的基本思想,是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。而在数据分析的实践中,常常需要人的参与,例如银行交易的异常分析,我们不能把所有转账数额巨大的交易都定义为异常。可视化数据分析需要模型,数据,领域专家三者之间的交互,实现人机互补。