初识机器学习-理论篇


大纲 Agenda

  • 什么是机器学习
  • 生活中的机器学习
  • 数据分析和机器学习
  • 常用算法
  • 框架
  • Demo

第1章 课程介绍

什么是机器学习

  • 利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
  • 确定性场景:明天太阳从东方升起
  • 不确定场景:明天公司的股票
  • 数据分析的主体是人,依靠人的经验和知识水平;机器学习的主体是机器,抛弃对人的依赖
  • 数据量越大,找出的规律越精准
  • 从数据中找规律-》数学规律,数学公式

第2章 认识机器学习

从数据中找规律

  • 机器学习的基石:概率论,数据统计
  • 传统统计学方式:抽样 -》描述统计 -》结论 -》假设检验

机器学习发展的原动力

  • 从历史数据中找规律,把这些规律用到对未来自动做出决定
  • 用数据代替expert
  • 经济驱动,数据变现

业务系统发展的历史

  • 基于专家经验
  • 基于统计————分维度统计
  • 机器学习————在线学习

第3章 机器学习的典型应用

机器学习的典型应用

  • 购物篮分析:纸尿布和啤酒

    • 关联规则
  • 用户细分精准营销:神州大众卡,全球通,动感地带,神州行

    • 聚类
  • 垃圾邮件

    • 朴素贝叶斯
  • 信用卡欺诈

    • 决策树
  • 互联网广告

    • ctr预估
  • 推荐系统

    • 协同过滤
  • 自然语言处理

    • 情感分析
    • 实体识别
  • 图像识别

    • 深度学习
  • 语音识别

  • 个性化医疗

  • 情感分析

  • 人脸识别

  • 自动驾驶


第4章 数据分析和机器学习的区别

机器学习和数据分析的区别

  • 数据特点

    • 交易数据 vs 行为数据
    • 少量数据 vs 海量数据
    • 采样分析 vs 全量分析
  • 解决业务问题不同

    • 数据分析:过去发生事情的总结
    • 机器学习:预测未来
  • 技术手段不同

  • 参与者不同

  • ………………


第5章 常见的算法和分类

机器学习算法分类

  • 有监督学习
  • 无监督学习
  • 半监督学习

机器学习常见算法

挖掘主题算法发表时间
分类C4.51993
聚类K-Means1967
统计学习SVM1995
关联分析Apriori1994
统计学习EM2000
链接挖掘PageRank1998
集装与推进AdaBoost1997
分类kNN1996
分类Naive Bayes2001
分类CART1984

第6章 解决问题

  • 不以业务需求为目标的机器学习都是耍流氓
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值