一.什么是机器学习
利用计算机从历史数据中找到规律,并把这些规律用到对未来不确定场景的决策。
1.1 价值(1)数据替代专家 (2)经济驱动,数据变现
二.应用
1.关联规则 如:啤酒与纸尿裤
2.聚类 如:用户的分类
3.
垃圾邮件(朴素贝叶斯) |
信用卡欺诈(决策树)
4.
互联网广告(ctr预估) |
推荐商品(协同过滤)
三.细分领域
1.自然语言处理: 情感分析 | 实体识别(文章中的专有名词:如:人名,地名)
2.图像识别:
3.语音识别
4.生物设别
5.自动驾驶
6.手势控制
7.视频内容识别
四.机器学习与数据分析的区别
1.交易数据 VS 行为数据 (搜索历史、点击历史、浏览历史、评论)
2.少量数据 VS 海量数据
3.采样分析 VS 全量分析
4.解决业务问题不同:OLAP(报告过去的事情)、机器学习(预测未来)
5.技术手段不同 : OLAP(用户驱动,交互式分析)、机器学习(数据驱动,自动进行知识发现)
6.参与者不同: OLAP(分析师决定结果)、机器学习(数据质量决定结果)
7.目标用户不同:OLAP(公司高层)、机器学习(个体)
五.机器学习常用算法
算法分类1
1.有监督学习
2.无监督学习(聚类)
3.半监督学习(强化学习)
算法分类2
1.分类与回归
2.聚类
3.标注
算法分类3
1.生成模型
2.判别模型