商业分析过程(business analytics process)
- 业务理解(Business understanding): 了解业务环境和你正在处理的事情。提出正确的商业问题和找到解决方案同样重要;
- 数据采集和理解(Data acquisition and understanding):了解特定业务目标所需的适当数据,以及如何(从哪里)获得适当数据;
- 构造模型(Modelling):建立一个数学上可靠的机制,在此基础上可以实现业务理解阶段中设定的业务目标。这是主要的,也是最具有数学挑战性的步骤;
- 部署(Deployment): 使用数据分析的结果,交给软件工程师和相关业务团队实施。
使用业务理解工具有助于对业务的理解: 如双钻石模型(The Double Diamond process),五问法(the Five Why technique)。
实际情况下,商业分析是一个学习和发现的递归过程。整个过程可能需要定期重复和更新,因为业务世界总是在不断变化。
在商业分析中,预测性建模对商业决策是否成功有着至关重要的作用,原因如下:
(1)大数据时代。互联网和数据采集设备(如移动电话、照相机、传感器、读卡器等)的出现,加上存储成本的大幅降低,带来了前所未有的数据可用性,数据集的规模继续大幅增长。
(2)先进的计算能力增加了探索数据中复杂模式的范围。
客户关系管理(Customer relationship management,CRM)
客户关系管理(CRM)是一套收集和研究客户资料的做法,目的是使 客户终身价值(customer lifetime value,CLV) 最大化,即客户在其整个生命周期内对公司的净价值。CRM 是以客户为中心(而非以品牌为中心)的商业战略的一部分,该战略侧重于客户满意度和忠诚度,以获取和保留有利可图的客户。
客户关系管理有四个主要领域: 客户获取、客户保留、客户流失和赢回。统计模型和机器学习算法在这些领域都扮演着重要的角色。
预测的种类
不同类型的数据导致不同类型的预测问题,预测的类型有:
- 横断面预测(cross-sectional prediction) ,使用在特定时间点收集的所有数据。例如,对于房屋价值评估,我们观察在特定的时间点(如2021年)几个变量,如销售价格,地点,房间数量,大小,等许多出售的房屋,任务是预测将要投放市场的房子的价值。
- 时间序列预测(time series forecasting) ,根据过去和当前的信息,预测未来某个特定时间点上某个变量的值。在这里,我们观察过去数据的时间和我们想要预测的时间是重要的。