机器学习和数据分析的区别
一:数据特点
- 交易数据 VS行为数据
- 少量数据VS海量数据
采样分析VS全量分析
Nosql:分布式,CAP,只能处理基于行为的数据
传统的结构化数据库都可以处理
二:解决业务问题不同
OLAP(报告过去的事情) | 机器学习(预测未来的事情) |
---|---|
过去三年哪些人是我们前100名的优质客户 | 前100个最有潜力的客户将是谁 |
和年初的计划相比,上个季度的销售业绩如何 | 明年各地区的销售额预计是多少 |
去年哪5次促销活动效果最好 | 明年的促销活动应该怎么搞 |
三:技术手段不同
特征 | OLAP | 数据挖掘 |
---|---|---|
信息请求冬季 | 企业里正在发生什么事情 | 基于正在发生的事情预测未来 |
数据力度 | 汇总数据 | 明细数据 |
维度数量 | 少量有限维度 | 大量维度 |
维度属性数量 | 少量属性 | 很多属性 |
数据集大小 | 小 | 大 |
分析方法 | 用户驱动,交互式分析 | 数据驱动,自动进行知识发现 |
分析技术 | 多维,钻取,多层次,多视角观察 | |
状态 | 成熟。落伍 | 发展阶段,部分已经成熟,流行 |
四:参与者不同
分析师能力决定结果 VS 数据质量决定结果
目标用户:公司高层 VS 个体