1.可视化本质就是传递信息。
2.可视化要做到正确(信)、清晰(达)、优雅(雅)地表达信息。
3.信:表格纵坐标最好从0开始,横坐标间隔一致。(衡量指标:谎言因子)
达:表达清楚信息的情况下用尽量少的元素。(衡量指标:数据墨水比=数据墨水/全部墨水)
雅:细节。
注意:信>达>雅;图表的设计不能过于依赖动画与交互;可视化的配色和可视化图表类型的选择非常重要。
4.色彩的三要素:(1)色调(色相),即色彩的相貌;(2)饱和度(纯度),即色彩的鲜艳程度(不同饱和度对应的内容重要性不同);(3)亮度(明度),即色彩的明亮程度。
5.选择色相:有12色相环、24色相环,相对的颜色是互补色,如橘黄色对上蓝色,可以选择互补色、近似色、三色搭配(对比更强烈)、四色搭配。
6.颜色空间(理解为坐标系):
(1)RGB(颜色代码,如#FF0000
;颜色RGB数值;颜色RGBA数值,比RGB数值多了透明度Alpha)
(2)HSV:色调、饱和度、亮度。用于可视化配色时缺点:能保证半径方向饱和度均匀变化,但不能保证圆周方向饱和度不变。
(3)HCL:为数据可视化而生,尽量保证色彩变换均匀。但常用软件上没有,可以使用Brewer调色板,用于可视化图表绘制,三种类型:定性型、分歧型、顺序型。
8.使用一种新的图表时,应该考虑的问题:(1)它展现的是数据哪方面的特征;(2)它适合怎样的数据。如果图表很少见,能否保证读者看懂这种图表;是否有必要用这种图表;是否有已有的常见图表能够展现相同的内容;它相比起已有的图表有什么优势。
9.对比型图表——柱状图/条形图:
(1)擅长表现数据之间的对比(也可以表达趋势但不太合适);
(2)竖向的柱状图分类太多时可能会出现文字重叠。
10.对比型图表——雷达图:
(1)擅长对比多维数据的图表(一般在4维及以上);
(2)有多个坐标轴,每个维度的坐标轴通常会进行缩放;
(3)围成的面积表现性能好坏。
注意各维度数值高低最好能反映性能好坏;应避免数据分类过多或变量过多。
11.趋势性图表——折线图:
反映数据的变化趋势,注意重点应在于趋势,折线图的横轴和纵轴应该是能够比较大小的。
12.趋势性图表——面积图/堆积面积图:
比折线图趋势会更加明显。注意面积图应透明显示,避免互相遮挡;堆积面积图必须确保数据分类可叠加。
13.分布型图表——散点图/气泡图:
看出数据的相关性、变化趋势、聚集情况。对于二维的散点图,如果想加上第三维,散点颜色的使用应优先于散点大小(气泡图)的使用。
14.分布型图表——直方图(柱状图和散点图的结合):
对数据分组后统计每个分组的数据量。
15.分布型图表——概率密度图
16.分布型图表——箱形图:
(1)学术中常用;(2)可以观察到数据的大致分布情况;(3)对数据的分布描述比较简单;(4)如果数据是双峰或多峰的分布形态则无法展示。
17.分布型图表——热力图、色块图:
前者的xy轴是离散值,后者的xy轴为连续值。
18.构成型图表——饼图、环形图:
不同类型大小可比、值可加;以扇形角度大小对比分类;分类不宜过多。
19.构成型图表——堆积百分比柱状图/堆积百分比面积图:
(1)多个分组均需要展示构成;(2)分组之间进行比较。
注意:(1)不用分类下相同维度的数据不是按照同一基准线对齐;(2)堆叠太多时会导致数据很难区分比对。
20.联系型图表——关系图:
数据样本与样本之间存在一定联系。关系图展现网络,也可以用散点+线绘制,节点位置分布可控。
21.联系型图表——和弦图:
节点数据沿圆周径向排列;节点之间使用带权重(有宽度)的弧线链接。
相比关系图,排版、节点、边有差异;数据可以相同。
22.联系型图表——桑基图:
节点之间存在层次区别;存在流向关系。
注意:对数据有要求,比较少用;表示流量,出入相等,保持流量的平衡。
23.联系型图表——旭日图:
构成图+父子节点关系;环图外层再加环;对数据有要求,比较少用。
24.Adobe公司宣布Flash于2020年停止更新,HTML5取代了Flash,HTML5技术是HTML+CSS+JavaScript的组合。
25.SVG和Canvas是两种基于浏览器的渲染方案。前者把图形渲染成矢量、可以将其保存为.svg格式、高保真、适合元素不多的情况;后者把图形渲染成像素点,只能运行于网页且需要用JavaScript来绘制,适合元素多的情况,图片放大到一定程度会模糊。
26.想绘出三维图形,可以使用WebGL,它是3D绘图协议,结合了JavaScript和OpenGL开放图形库。
27.时空大数据的Web可视化:
思路一:静态Web,事先准备好数据。即实现安排好用户所有可能的交互操作、计算好所有的可视化结果,不需要后端再计算数据。
思路二:动态Web,前端与后端融合。
28.在线可视化工具:
(1)SandDance:微软开发,官网,不适合用于地理空间数据的可视化。
(2)Kepler:只能显示空间上的变化,空间上的不行,是静态的
(3)Mobmap:可以同时显示空间和时间数据,可以是动态的。
(4)Echarts 和pyecharts :echars可视化思路——用python进行数据整理成为json文件,然后javascript读取数据,在网页端进行可视化。
该网址上有一些js实例及代码
29.在ppt中制作论文插图,学到了!一般保存为svg格式,保存成jpg或png格式可能会导致分辨率不高,一般图片dpi是300就足够了。
要查找矢量图可以在该网站上查找