说到数据可视化,大家可谓耳熟能详,设计师、数据分析师、数据科学家等,都用各种方式各种途径做着数据可视化的工作…
实际上,我们每一个人,天生具有可视化思维,甚至经常性地做一些可视化操作。
比如,做工作总结 PPT,要尽量字少有图; 展示报表,会选择柱状图;走在马路上,更容易被图形而不是文字吸引…这并不是因为我们聪明,只是大脑讨厌枯燥的数据,天生喜欢鲜明直观的可视化图形。
下面我们看个例子。
2018 年中美“贸易战”,美国的媒体为了向美国老百姓说明中国经济发展的情况,特别是对美国经济的威胁,一定要使用到中国经济和美国经济相关数字。那么,你觉得这些数字怎么展示?
图 1 常规展示中美 GDP (图片来源)
这是一张预测中美 GPD 走势的图示。看此图,我想,美国人也没有什么太被刺激的感觉,因为看看两条线,未来即使有高低之别,但差别也没有那么吓人,况且,预测还可能不准确呢。
再对比图 2。
图 2 可视化表示中美 GDP(图片来源)
虽然这张图中也包含了数字,但是,它同时配置了表示数字的图示,并且都很形象,人的视觉无形中就被图示所吸引了。把数字本来的抽象意义,用直观方式表达出来,更刺激人的大脑。
这是个普通的数据可视化案例。今天我们想跟大家分享的是数据科学领域的数据可视化。分享的过程中,我们会明白,数据可视化已经成为数据时代程序员的必备技能。
我们从数据科学开始说起。
数据科学
下面的定义来自“维基百科”中的“数据科学”词条。
数据科学(