初识机器学习-理论篇

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wwwdc1012/article/details/72596189


大纲 Agenda

  • 什么是机器学习
  • 生活中的机器学习
  • 数据分析和机器学习
  • 常用算法
  • 框架
  • Demo

第1章 课程介绍

什么是机器学习

  • 利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
  • 确定性场景:明天太阳从东方升起
  • 不确定场景:明天公司的股票
  • 数据分析的主体是人,依靠人的经验和知识水平;机器学习的主体是机器,抛弃对人的依赖
  • 数据量越大,找出的规律越精准
  • 从数据中找规律-》数学规律,数学公式

第2章 认识机器学习

从数据中找规律

  • 机器学习的基石:概率论,数据统计
  • 传统统计学方式:抽样 -》描述统计 -》结论 -》假设检验

机器学习发展的原动力

  • 从历史数据中找规律,把这些规律用到对未来自动做出决定
  • 用数据代替expert
  • 经济驱动,数据变现

业务系统发展的历史

  • 基于专家经验
  • 基于统计————分维度统计
  • 机器学习————在线学习

第3章 机器学习的典型应用

机器学习的典型应用

  • 购物篮分析:纸尿布和啤酒

    • 关联规则
  • 用户细分精准营销:神州大众卡,全球通,动感地带,神州行

    • 聚类
  • 垃圾邮件

    • 朴素贝叶斯
  • 信用卡欺诈

    • 决策树
  • 互联网广告

    • ctr预估
  • 推荐系统

    • 协同过滤
  • 自然语言处理

    • 情感分析
    • 实体识别
  • 图像识别

    • 深度学习
  • 语音识别

  • 个性化医疗

  • 情感分析

  • 人脸识别

  • 自动驾驶


第4章 数据分析和机器学习的区别

机器学习和数据分析的区别

  • 数据特点

    • 交易数据 vs 行为数据
    • 少量数据 vs 海量数据
    • 采样分析 vs 全量分析
  • 解决业务问题不同

    • 数据分析:过去发生事情的总结
    • 机器学习:预测未来
  • 技术手段不同

  • 参与者不同

  • ………………


第5章 常见的算法和分类

机器学习算法分类

  • 有监督学习
  • 无监督学习
  • 半监督学习

机器学习常见算法

挖掘主题 算法 发表时间
分类 C4.5 1993
聚类 K-Means 1967
统计学习 SVM 1995
关联分析 Apriori 1994
统计学习 EM 2000
链接挖掘 PageRank 1998
集装与推进 AdaBoost 1997
分类 kNN 1996
分类 Naive Bayes 2001
分类 CART 1984

第6章 解决问题

  • 不以业务需求为目标的机器学习都是耍流氓
阅读更多

没有更多推荐了,返回首页