大纲 Agenda
- 什么是机器学习
- 生活中的机器学习
- 数据分析和机器学习
- 常用算法
- 框架
- Demo
第1章 课程介绍
什么是机器学习
- 利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
- 确定性场景:明天太阳从东方升起
- 不确定场景:明天公司的股票
- 数据分析的主体是人,依靠人的经验和知识水平;机器学习的主体是机器,抛弃对人的依赖
- 数据量越大,找出的规律越精准
- 从数据中找规律-》数学规律,数学公式
第2章 认识机器学习
从数据中找规律
- 机器学习的基石:概率论,数据统计
- 传统统计学方式:抽样 -》描述统计 -》结论 -》假设检验
机器学习发展的原动力
- 从历史数据中找规律,把这些规律用到对未来自动做出决定
- 用数据代替expert
- 经济驱动,数据变现
业务系统发展的历史
- 基于专家经验
- 基于统计————分维度统计
- 机器学习————在线学习
第3章 机器学习的典型应用
机器学习的典型应用
购物篮分析:纸尿布和啤酒
- 关联规则
用户细分精准营销:神州大众卡,全球通,动感地带,神州行
- 聚类
垃圾邮件
- 朴素贝叶斯
信用卡欺诈
- 决策树
互联网广告
- ctr预估
推荐系统
- 协同过滤
自然语言处理
- 情感分析
- 实体识别
图像识别
- 深度学习
语音识别
个性化医疗
情感分析
人脸识别
自动驾驶
第4章 数据分析和机器学习的区别
机器学习和数据分析的区别
数据特点
- 交易数据 vs 行为数据
- 少量数据 vs 海量数据
- 采样分析 vs 全量分析
解决业务问题不同
- 数据分析:过去发生事情的总结
- 机器学习:预测未来
技术手段不同
参与者不同
………………
第5章 常见的算法和分类
机器学习算法分类
- 有监督学习
- 无监督学习
- 半监督学习
机器学习常见算法
挖掘主题 | 算法 | 发表时间 |
---|---|---|
分类 | C4.5 | 1993 |
聚类 | K-Means | 1967 |
统计学习 | SVM | 1995 |
关联分析 | Apriori | 1994 |
统计学习 | EM | 2000 |
链接挖掘 | PageRank | 1998 |
集装与推进 | AdaBoost | 1997 |
分类 | kNN | 1996 |
分类 | Naive Bayes | 2001 |
分类 | CART | 1984 |
第6章 解决问题
- 不以业务需求为目标的机器学习都是耍流氓