一、机器学习是利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
二、观察数据--用模型刻画(拟合)规律
三、机器学习发展的原动力:
从历史数据中找出规律,把这些规律用到对未来自动做出决定;用数据代替expert;经济驱动,数据变现
四、业务系统发展的历史:基于专家经验、基于统计--分纬度统计、机器学习--在线学习
五、机器学习的典型应用:
购物篮分析:关联规则:啤酒纸尿裤(沃尔玛)
用户细分精准营销 聚类
垃圾邮件 朴素贝叶斯
信用卡欺诈 决策树
互联网广告 ctr预估
推荐系统 协同过滤
自然语言处理 情感分析、实体识别
图像识别 深度学习
语音识别、个性化医疗、情感分析、人脸识别、自动驾驶
智慧机器人、私人虚拟助理、手势控制、视频内容自动识别、机器实时翻译
六、机器学习和数据分析区别:
数据特点:
交易数据VS行为数据
少量数据VS海量数据
采样分析VS全量分析
解决业务问题不同
技术手段不同
参与者不同
分析师VS数据+算法
目标用户 公司高层VS个体
七、机器学习算法分类
机器学习算法分类一:
有监督学习:分类算法、回归算法
无监督学习
半监督学习
机器学习算法分类二:
分类与回归
聚类
标注
机器学习算法分类三:
生成模型:陪审团
判别模型:大法官
八、机器学习解决问题的框架:
确定目标
训练模型
模型评估
交叉验证
效果评估