长久以来,作为在信息管理领域服务多年的IBM人,就一直有个梦想:当业务人员需要分析公司的经营状况时,当市场部需要在特定时间做精准营销时,当老总紧急临时需要某条业务线的汇总数据时,我们可以有个系统马上及时、准确提供数据,漂亮美观地满足各种需求,实现数据驱动业务的目标!我们长久向往超市的模式:需要买东西的顾客轻松自在地在宽敞、整洁的货架上自由选择,当选择结束后,自行去收银台结账付款,需求满足、货品组合完全由顾客自主完成!超市员工所要做的就是整理货架、安排新货品、设计新的商品组合......
好吧,我们先设定一个小目标:
在经典的数据分析场景中,我们需要至少4类人员参与,分别是业务分析师、数据工程师、应用开发员以及数据科学家。
分析过程需要业务分析师提需求,数据工程师整理数据和按照一定原则设计数据组合,然后数据科学家按照业务的理解设计合适的数学模型以及验证其合理性,最后由应用开发员把一切变成最终业务分析人员使用的应用。
我们今天提供这么一个应用(假设原型)吧:我们姑且称之为数据集市