初识机器学习—理论篇

  1. 什么是机器学习?
    计算机>
    历史数据(原材料)>
    找出规律(用模型刻画得到数学函数、数学公式)>
    决策未来的不确定场景。(系统自动生成)

  2. 机器学习发展的原动力
    用数据代替expert、经济驱动、数据变现

  3. 业务系统发展的历史
    基于专家经验
    基于统计——分纬度统计
    机器学习——在线学习(实时调整如电商、百度)

  4. 机器学习的典型应用
    (1)场景:啤酒+纸尿裤 购物篮分析
    算法:关联规则
    (2)用户细分精准营销
    算法:聚类
    (3)垃圾邮件
    算法:朴素贝叶斯
    (4)信用卡欺诈
    算法:决策树(银行用于风险识别)
    (5)互联网广告
    算法:ctr预估(广告顺序基于用户点击率的预估)
    (6)推荐系统
    算法:协同过滤(淘宝多用)
    (7)自然语言处理
    应用场景(情感分析、实体识别)
    (8)深度学习
    应用场景(图像识别)

“机器学习无处不在!”

**5.**机器学习和数据分析的区别
(1)数据特点:行为数据(用户搜索、点击、浏览历史) VS 交易数据(和钱有关)
海量数据 VS 少量数据
全量分析 VS 采样分析

(2) 解决业务问题:预测未来之事 VS 报告过去之事

(3) 技术手段:算法和数据驱动(大量维度和属性) VS 用户驱动(分析师经验、维度有限)

(4) 参与者:数据质量决定结果 VS 分析师能力决定结果
目标用户:个体 VS 公司高层

6.机器学习算法分类
(1)有监督学习:分类算法、回归算法(训练模型中含有y)
无监督学习:聚类算法 (训练模型中无y)
半监督学习:迭代强化y

(2)分类与回归
聚类
标注:

(3)生成模型:如陪审团指出属于某类的概率
判别模型:如大法官直指目的非一即二

7.机器学习解决问题的框架
(1)业务需求
数据
特征工程

(2)训练模型
定义模型:函数
定义损失函数:定义预测结果与真实结果偏差大小
优化算法:

(3)模型评估
交叉验证
效果评估

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值