数据分析生命周期:
从数据到决策的过程。
1.询问:业务挑战、目标、问题
2.准备:数据生成、收集、存储、管理
3.处理:数据清洗、数据完整性
4.分析:数据探索、可视化和分析
5.分享:交流和解释结果
6.行动:将见解付诸实践以解决问题
EMC的数据分析生命周期:
EMC Corporation 的数据分析生命周期是循环的,分为六个步骤:
1.发现数据
2.预处理数据
3.模型规划
4.建筑模型
5.交流结果
6.行动
EMC Corporation 现在更名为 Dell EMC。这个模型由 David Dietrich 创建,反映了现实世界项目的周期性。这些阶段不是静态的里程碑;每一步都连接并通向下一步,并最终重复。关键问题可帮助分析师测试他们是否已取得足够的成就以继续前进,并确保团队在每个阶段都花费了足够的时间,并且在数据准备好之前不要开始建模。它与这个程序所基于的数据分析生命周期略有不同,但它有一些共同的核心思想:第一阶段是对发现和提出问题感兴趣;必须先准备好数据,然后才能对其进行分析和使用;然后应该分享调查结果并采取行动。
SAS的迭代生命周期:
迭代生命周期由一家名为SAS的公司创建,该公司是领先的数据分析解决方案提供商。它可用于产生可重复、可靠和可预测的结果:
1.询问
2.准备
3.探索
4.建模