![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
动手学深度学习学习整理
文章平均质量分 75
动手学深度学习学习整理
等风来随风飘
这个作者很懒,什么都没留下…
展开
-
06_多层感知机_模型选择、欠拟合和过拟合笔记
4.4. 模型选择、欠拟合和过拟合作为机器学习科学家目标是发现模式。确定模型是真正发现了一种泛化的模式,而不是简单地记住了数据模式捕捉到训练集中的潜在总体的规律困难:训练模型时仅拥有少量样本数据,当收集到更多的数据时,会发现之前找到的明显关系并不成立将模型在训练数据上拟合得比在潜在分布中更接近的现象称为过拟合(训练结果较好且与测试结果相差较大)用于对抗过拟合的技术称为正则化4.4.1. 训练误差和泛化误差训练误差:模型在训练数据集上计算得到的误差泛化误差:将模型应用在同样从原始样本的分原创 2021-12-02 20:02:10 · 639 阅读 · 0 评论 -
05_多层感知机_多层感知机笔记
4. 多层感知机多层感知机:最简单的深度网络,由多层神经元组成,每一层都与下面一层(从中接收输入)和上面一层(反过来影响当前层的神经元)完全相连训练大容量模型时,面临着过拟合的风险4.1. 多层感知机4.1.1. 隐藏层仿射变换:带有偏置项的线性变换(线性变换:线性空间V到其自身的线性映射)4.1.1.1. 线性模型可能会出错线性意味着单调假设:特征的任何增大都会导致模型输出增大(如果对应的权重为正),或者导致模型输出减少(如果对应的权重为负)对于深度神经网络,使用观测数据来联合学原创 2021-12-02 11:13:14 · 566 阅读 · 0 评论 -
04_线性神经网络_softmax回归笔记
3.4. softmax回归通常,机器学习实践者用分类这个词来描述两个有微妙差别的问题:(1)只对样本的硬性类别感兴趣,即属于哪个类别;(2)希望得到软性类别,即得到属于每个类别的概率。这两者的界限往往很模糊。其中的一个原因是,即使只关心硬类别,仍然需要使用软类别的模型。3.4.1. 分类问题当分类问题类别间存在自然顺序可以用数值代表每个类别,一般的分类问题并不与类别之间的自然顺序有关,可以使用独热编码。独热编码是一个向量,它的分量和类别一样多。类别对应的分量设置为1,其他所有分量设置为0原创 2021-12-01 14:36:41 · 1146 阅读 · 0 评论 -
03_线性神经网络_线性回归笔记
3.线性神经网络3.1. 线性回归回归:一类为一个或多个自变量与因变量之间关系建模的方法。在自然科学和社会科学领域,回归经常用来表示输入和输出之间的关系。3.1.1. 线性回归的基本元素线性回归基本假设:自变量和因变量之间为线性关系(因变量为自变量的加权和,通常允许包含观测值的一些噪声)任何噪声都比较正常,如噪声遵循正态分布3.1.1.1. 线性模型权重决定了每个特征对预测值的影响偏置是指当所有特征都取值为0时,预测值应该为多少(没有偏置会限制模型的表达能力)给定训练数据特征X和原创 2021-11-30 16:40:48 · 833 阅读 · 0 评论 -
02_预备知识笔记
2.预备知识2.1. 数据操作n 维数组,也称为张量(tensor)2.1.1. 入门张量表示由一个数值组成的多维数组向量:具有一个轴的张量矩阵:具有两个轴的张量具有两个轴以上的张量没有特殊的数学名称。...原创 2021-11-30 10:31:13 · 151 阅读 · 0 评论 -
01_前言笔记
1. 前言机器学习从经验中学习。 通常观测数据或与环境交互积累经验,逐步提高性能。1.1. 日常生活中的机器学习机器学习任务:收集样本数据集由算法参数决定输出通过对数据集中样本的学习决定最佳参数集参数通过某种性能度量来获取完成任务的最佳性能模型:任一调整参数的程序。模型族:通过操作参数而生成的所有不同程序(输入-输出映射)的集合。学习算法:使用数据集来选择参数的元程序。机器学习中学习是一个模型的训练过程。 通过这个过程发现正确的参数集,使模型强制执行所需的行为。( 用数据训练模型)原创 2021-11-29 11:36:30 · 197 阅读 · 0 评论