为什么要进行可视化,是因为图承载信息能量巨大,并且在繁杂的数据中找规律,向别人介绍数据的价值,都离不开可视化。从数据到信息,中间过程并不是简单的图表——而是设计过的图表。
看到那么多好的图,自己有不算多但也够用的数据。可是如何从数据到图,显然不是自己想的那么简单。
首先,过多的可视化工具, 让自己颇为应接不暇,疲于在其中穿梭。做可视化,需要的是数据和作品,开发工具显然现在已经不是自己鞭长可及的了。现在,会应用,能将数据很好的可视化,知道需要处理什么样的数据用什么样的图表,是第一步。数据可视化涉及多个方面,不仅要讲出好故事,还要设计出足够支撑故事的图表,都需要本事。至于技术,数据处理与挖掘、可视化过程涉及的编程思想,都是很需要思考和实践的。这条路个人感觉有意思,只是能不能转化为money,拭目以待。
现在遇到的最大问题是,抱着一堆数据怎么下手,图表不是简单的柱状图,尤其在较大的数据量上,怎么提取,筛选,来达到说明问题、解决问题的目的。
我现在是这么做的:
第一步,切实了解问题症结所在——一方面是配送问题,并不是路径优化,因为在小区域内,路径优化所能实现的效果微乎其微(尚未调研,需要讨论),主要问题是几个区域间的配送量与时间上的分配与预测;另一方面,是对不同菜品的提前准备与推荐,针对每个用户的话,也涉及到几个关键问题,中午与晚上数量的变化、价格的问题、偏好的问题等,都是对推荐的影响
第二步,针对已经出现的问题,整理并量化数据,这一步并没有做的很好,问题在于现在技术不过关,现在数据上升不到大数据,但是纯手工浪费精力会很多,摸索中长点心。
第三步,处理好的数据,如何分析和可视化,这是关键,一部分常规的柱状图与折线图可以很好的做出来,但是基于位置信息的,菜品数量很大的,时间周期很长的,基于个性化推荐的这些问题,传统的图表很难展现,需要进一步搜索,另一方面是作图难度并不是自己想的那么小。
第四步,针对出现的问题,对数据进行进一步处理,包括预测模型建立,推荐模型的建立
第五步,得出结论,改善配送问题。
总之,这个过程要形成模式,一方面可复制,另一方面也要有自己的特点。怎么能拿得出手。
今天的目标是地图可视化。用R来完成。其余柱状图等处理依赖tableau。期待实现。