深度学习基础知识(定义)

         深度学习是机器学习的一个特定的分支。所以先总结机器学习的相关知识点。

         学习的定义:Mitchell (1997) :对于某类任务 T性能度量P,一个计算机程序被认为可以从经验E 中学习是指,通过经验E 改进后,它在任务 T 上由性能度量P 衡量的性能有所提升。

         T   通常机器学习任务定义为机器学习系统该如何处理样本 (example)。样本是指我们从某些希望机器学习系统处理的对象或事件中收集到的已经量化的特征 (feature)的集合。我们通常会将样本表示成一个向量 x ∈ R n ,其中向量的每一个元素 x i 是一
个特征。例如,一张图片的特征通常是指这张图片的像素。

        P   通常性能度量P 是特定于系统执行的任务 T 而言的。就分类问题来讲,准确率和错误率是常见的度量准则。准确率是指该模型输出正确结果的样本比例。错误率是指该模型输出错误结果的样本比例。

       E   根据学习过程中的不同经验,机器学习算法可以大致分类为无监督 (unsupervised) 和监督 (supervised)。无监督学习算法 (unsupervised learning algorithm) 训练含有很多特征的数据集,然后学习出这个数据集上有用的结构性质。监督学习算法 (supervised learning algorithm) 训练含有很多特征的数据集,不过数据集中的样本都有一个标签 (label) 或目标 (target)。                

无监督学习和有监督学习的对比
无监督学习无标签聚类降维先聚类后定性非独立数据更适合可解释可拓展
有监督学习有标签分类同维分类同时定性独立数据更适合不透明不可轻易拓展

        在选择模型是有监督学习还是无监督学习时需要注意:①特征值是离散变量还是连续变量;②特征值是否有缺失项;③若有缺失的特征值判定是哪种原因造成的;④某个特征发生的频率如何。

泛化:在先前未观测到的输入上表现良好的能力。

在训练集上计算一些度量误差,被称为训练误差 (training error)。

泛化误差(也称测试误差)被定义为新输入的误差期望。

决定机器学习算法效果是否好的因素:
1. 降低训练误差;
2. 缩小训练误差和测试误差的差距。

       这两个因素对应机器学习的两个主要挑战:欠拟合 (underfitting) 和过拟合 (overfitting)。欠拟合发生于模型不能在训练集上获得足够低的误差。过拟合发生于训练误差和和测试误差之间的差距太大。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值