背景
大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity) 。
大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
大部分公司目前还是在用Excel在进行数据分析:收集数据、统计分析、做报表。针对大数据分析的场景,需要逐渐转而使用大数据工具。但是大数据分析工具在易用性和友好性上不是足够好,特别对于熟练使用Excel业务分析人员。比如下图中的Excel分析报表。
解决方法
需要一款针对大数据优化的、又有电子表格易用性的工具,来帮助业务人员进行业务分析。这款工具起码要求以下的能力:
- 支持大数据数据库:现在业务数据是在大数据数据库中,比如Hive、MaxCompute。大数据数据库与关系型数据库最大的不同时,大数据数据库执行是异步的,查询时长进行性超过5分钟,甚至半小时。从而使从亿级数据中汇总想要的数据。
- 支持数据加速:需要针对这种查询的性能特别的优化,让查询从分钟级加速到秒级。
- 支持数据录入:一般的Excel是有需要手工输入的数据存在,比如KPI目标的目标值。所以需要有一个方