机器学习
一、什么是机器学习?
1、机器学习的概念
利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
2、机器学习的基础
概率论:机器学习的基础
数据统计:从数据中寻找规律
抽样-->描述统计-->结论-->假设检验
用模型刻画(拟合)规律:维度1-2个之内的,还可以进行可视化的看到,维度再多就只能用数学计算了
二、为什么要用机器学习?
--从历史数据中寻找规律,把这些规律用到对未来自动做出决定
--用数据代替expert
--经济驱动,数据变现
三、机器学习分类
--离线机器学习
每天定时跑一个任务,根据历史行为做出一个训练模型,每天生成一个一个新的模型
--在线机器学习
实时的做出模型的调整
四、机器学习的典型应用
--啤酒 + 纸尿裤
购物篮分析:关联规则 典型的数据挖掘
--手机卡的分类
用户细分精准营销:聚类 典型的机器学习
--垃圾邮件识别
朴素贝叶斯
--信用卡欺诈
决策树
--互联网广告
ctr预估
--推荐系统
协调过滤
--自然语言处理
情感分析
实体识别
--图像识别
深度学习
五、数据分析与机器学习的区别
数据特点:
交易数据(有关钱的) 行为数据
少量数据 海量数据
采样分析 全量分析
一致性高
.
.
.
.
.
下面是我的公众号,收集了现在主流的大数据技能和架构,欢迎大家一起来学习交流。