深度学习基础知识（1）

最新推荐文章于 2020-03-14 10:17:45 发布

2021乐乐

最新推荐文章于 2020-03-14 10:17:45 发布

阅读量110

点赞数

分类专栏：机器学习文章标签：链式法则

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42528089/article/details/98870649

版权

机器学习专栏收录该内容

36 篇文章 1 订阅

订阅专栏

1：将数据集和测试集分开是为了提高模型的泛化能力。泛化能力是指未处理过的数据能力，获取模型的泛化能力是机器学习的目标,避免过拟合是机器学习的重要内容。

2: 神经网络所用的指标称为损失函数，损失函数可以使用任意函数，但是一般用均方误差和交叉熵的表示比较多。

3： mini-batch 学习；用随机选取的小批量数据作为全体训练数据的近似值。

4：为什么要设置损失函数为指标，在微小参数变化的前提下，因为准确率（Ac）的变化是不连续的，而损失函数的变化是连续的。激励函数的作用也很重要，需要像竹筒倒石一样，应该有反方，比如sigmoid 函数，阶跃函数就不是好的选择。

在进行神经网络学习时，不能讲识别精度作为指。因为如果以识别精度作为指标，则参数的导数在绝大多数的地方都会变为0.

5：导数的误差，f(x+h)-f(x-h) 的误差比f(x+h)-f(x) 的误差要小。

6: 全部变量的偏导数汇总而成的向量称为梯度。梯度所指的方向是各点处的函数值较少最多的方向。通过梯度来寻找函数最小值的方法是梯度法。

7：学习率这种参数被称为超参数，因为神经网络的参数是通过训练得到的，就是学习率需要通过手工来调整。设置多个参数查看那个参数效果最好。

8：链式法则：

如果某个函数由复合函数表示，则该复合合函数的导数可以用构成复合函数的各个函数的倒数的乘积表示。

4：深度学习，机器学习，算法的区别，

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习基础知识（1）

1：将数据集和测试集分开是为了提高模型的泛化能力。泛化能力是指未处理过的数据能力，获取模型的泛化能力是机器学习的目标,避免过拟合是机器学习的重要内容。2: 神经网络所用的指标称为损失函数，损失函数可以使用任意函数，但是一般用均方误差和交叉熵的表示比较多。3： mini-batch 学习；用随机选取的小批量数据作为全体训练数据的近似值。4：为什么要设置损失函数为指标，在微小参数变化的...
复制链接

扫一扫

专栏目录

博客等级

码龄6年

267
原创

496
点赞

2678
收藏

229
粉丝

关注

私信

热门文章

分类专栏

最新评论

STM32 ADC采样率如何计算
yuehao0929: 转换时间=采样时间+12个时钟周期，在哪里找到的
STM32 ADC采样率如何计算
FPGA小白菜: ADC时钟分频系数是多少？ 2和8？ PCLK2的最大时钟是84M，最小时钟的10.5M
matlab 小波的分解与重构
2401_82597658: 您好。我的数据里面有一列是时间，一列是时间对应的点。我打算将我的这个信号小波分解，找特征值。而，MATLAB只的X信号只能是一列。我不知道怎么处理我的时间列。谢谢您。
matlab 或者python 数组名连续命名
xiaosandian: 请问博主，连续命名之后怎么赋值呢？直接Mi=···好像不行
MOS 管开关极限频率的计算
阿K的乔巴: 这个开关频率具有普遍性麻？都是所有时间当中最长的1/7到1/10麻？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。