精通机器学习:基于R(一)

"诸事皆殚精竭虑者,终将一事无成。"

1.定义机器学习:

机器学习是使用数据对模型进行的训练,它针对某种性能指标形成决策。

2.过拟合和欠拟合

偏差是模型的预测值或预测水平与训练数据中的实际值或实际水平之间的差别。

方差是训练数据集的预测值或预测水平相对于其他数据集的预测值或预测水平的离散程度。

总体误差=偏差+方差

第一章 成功之路

“如果你不能将要做的事情描述成一个流程,那么你就不知道自己在做什么。”

1.1流程

1.2业务理解

1)确定业务目标(谁,什么,何时,何地,为什么)

2)现状评估

3)确定分析目标

4)建立项目计划

1.3数据理解

1)数据收集

2)数据描述

3)数据探索

4)数据质量校验

1.4数据准备

1)数据选择

2)数据清洗

3)数据构建

4)数据整合

5)数据格式化

1.5建模

1)选择建模技术

2)设计检验方法

3)建立模型

4)评估模型

1.6评价

1)评估结果

2)回顾过程

3)确定下一步

1.7部署

1)按计划部署

2)检测与维护

3)完成总结报告

4)项目回顾

1.8算法流程图

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值