时间序列是一个十分常见的数据类型。几乎所有商业上的数据集,都有一个时间的dimension。而很多商业的数据分析,也是集中在数据随着时间的流动的变化规律。我们这里通过对北京的房价数据做一个时间序列分析,从而探讨一下不同可视化方式的有效性。
下面是北京房屋均价在2009和2010的数据集(部分显示)。
对时间序列最简单的显示,是把时间放在X轴,把数据通过折线画在Y轴。因为折线很自然地表示了一种趋势,我们可以很容易地把数据根据时间的变化很清晰的表现出来。
通过图表,我们可以很快地观察到各个区域房价变化的趋势和幅度。房价在2009年底前,基本保持了一个平稳增长的趋势。2009年底到2010年初,房价有一个比较大的跳跃。尤其是四环内的房价。在短时间内增长了超过百分之三十。
但由于四个地区房价绝对值差别很大,如果我们想比较房价增长值的百分比就不是很容易。最直观的办法是把百分比变化直接画在图上。
我们看到房价的变化基本保持了同样的趋势,但到了后期有了一些不同的分岔。
在我们观察这个图表时,因为折线图的特点,我们会下意识地注意到数据的变化,而不是互相间的比较。如果我们想表达不同地区的同一时间的价格的比较,我们可以把图形改为条形图。
大部分软件会生成一个类似下图的图表。
因为所有的数据都混杂在一起,我们想要达到的易于比较的目的并没有达到。为了解决这个问题,我们可以把四组数据分别在四个排列在一起的小图表里显示。
更多文章请关注:http://www.inetsoft.com.cn/