-
什么是机器学习?
计算机>
历史数据(原材料)>
找出规律(用模型刻画得到数学函数、数学公式)>
决策未来的不确定场景。(系统自动生成) -
机器学习发展的原动力
用数据代替expert、经济驱动、数据变现 -
业务系统发展的历史
基于专家经验
基于统计——分纬度统计
机器学习——在线学习(实时调整如电商、百度) -
机器学习的典型应用
(1)场景:啤酒+纸尿裤 购物篮分析
算法:关联规则
(2)用户细分精准营销
算法:聚类
(3)垃圾邮件
算法:朴素贝叶斯
(4)信用卡欺诈
算法:决策树(银行用于风险识别)
(5)互联网广告
算法:ctr预估(广告顺序基于用户点击率的预估)
(6)推荐系统
算法:协同过滤(淘宝多用)
(7)自然语言处理
应用场景(情感分析、实体识别)
(8)深度学习
应用场景(图像识别)
“机器学习无处不在!”
**5.**机器学习和数据分析的区别
(1)数据特点:行为数据(用户搜索、点击、浏览历史) VS 交易数据(和钱有关)
海量数据 VS 少量数据
全量分析 VS 采样分析
(2) 解决业务问题:预测未来之事 VS 报告过去之事
(3) 技术手段:算法和数据驱动(大量维度和属性) VS 用户驱动(分析师经验、维度有限)
(4) 参与者:数据质量决定结果 VS 分析师能力决定结果
目标用户:个体 VS 公司高层
6.机器学习算法分类
(1)有监督学习:分类算法、回归算法(训练模型中含有y)
无监督学习:聚类算法 (训练模型中无y)
半监督学习:迭代强化y
(2)分类与回归
聚类
标注:
(3)生成模型:如陪审团指出属于某类的概率
判别模型:如大法官直指目的非一即二
7.机器学习解决问题的框架
(1)业务需求
数据
特征工程
(2)训练模型
定义模型:函数
定义损失函数:定义预测结果与真实结果偏差大小
优化算法:
(3)模型评估
交叉验证
效果评估