cs231n斯坦福基于卷积神经网络的CV学习笔记（二）神经网络训练细节

最新推荐文章于 2022-06-19 10:28:46 发布

@ZeKing

最新推荐文章于 2022-06-19 10:28:46 发布

阅读量274

点赞数

分类专栏： CS231n

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41553038/article/details/82942930

版权

CS231n 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

五，神经网络

注意点part1

实例：逻辑回归二层神经网络训练函数
使用权重w和偏差值biase计算出第一个隐含层h，然后计算损失，评分，进行反向传播回去
多种常用激活函数（一般默认max（0，x）），如sigmoid函数具有饱和区梯度0，非零点中心，计算x复杂等缺点，max(Relu)函数也有缺点（非中心对称，初始化不佳（如-10）无法激活，注意学习速率不要太高），leaky Relu优化max（0.01x，x），其中0.01为α修正参数可调，maxout集合Lrelu，Relu的优点，只是参数变多了。
少量数据可用L-BFGS优化，数据量大的一般用不到
神经网络的深度（层数，数据越复杂越多越好，简单则不需要太多）和宽度（各层神经元数）

注意点part2

数据预处理可用PCA,SVD等方法
. 权重初始化，待深入，很重要，如Batch Nomalization
神经网络隐藏层（hidden layer）
训练数据要过饱和Overfit
超参数调整学习速率，正则化参数（以及差量），更新方式
Track the ratio of weight updates / weight magnitudes:

训练神经网络的四个步骤（样本（标准化，初始化权重等），向前传播（得到损失），向后传播（得到每个权重的梯度），用梯度更新【梯度下降】参数（w等））

训练神经网络的四个步骤

– 激活函数提供了更多的非线性的数据存储（处理）方式。

在这里插入图片描述

下面所讲
在这里插入图片描述

– 1，其他参数更新方法，针对SGD更新较慢（y轴快水平慢，波动式前进）,但一般还是默认用SGD

1,moumentum更新，收敛更快（mu为超参数，v为速度（可初始化为0））好
2 nestero momentum (Nag)好好

3，adaGrad update（一般在凸问题中用，回停止学习-0）

针对不同方向的梯度调整快慢（补偿）–通过分母（梯度平方），大慢小快

3.2改进版（不会停止学习）
1e-7是平滑因子，只是未来防止它变0
4，另一种

5，Adam更新（结合MOMENTEUM和RMSprop-like）很好，可以经常采用

在这里插入图片描述
beta是超参数0.9，0.995

1.2，优化学习速率（超参数，可用衰减函数控制（一阶函数））

在这里插入图片描述

其他优化方法

在这里插入图片描述
二阶函数，求出梯度（碗的曲率），知道怎么走就不需要学习速率更新就知道怎么到达最低点了，收敛（但hessian矩阵太大求逆计算量巨大，而基本不采用）
再优化（数据集不大时可用）一般也不用

总结：一般都用Adam来优化

在这里插入图片描述

随机失活dropput（regularization），简单但是效果机器号

在这里插入图片描述
好方法，可以防止过拟合等

P=0.5

梯度检查gradient checking

自学

卷积神经网络

详解见下一章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
cs231n斯坦福基于卷积神经网络的CV学习笔记（二）神经网络训练细节

五，神经网络实例：逻辑回归二层神经网络训练函数使用权重w和偏差值biase计算出第一个隐含层h，然后计算损失，评分，进行反向传播回去多种常用激活函数（一般默认max（0，x）），如sigmoid函数具有饱和区梯度0，非零点中心，计算x复杂等缺点，max(Relu)函数也有缺点（非中心对称，初始化不佳（如-10）无法激活，注意学习速率不要太高），leaky Relu优化max（0.01x，x...
复制链接

扫一扫

专栏目录

@ZeKing CSDN认证博客专家 CSDN认证企业博客

码龄6年

46: 原创

10万+: 周排名

147万+: 总排名

7万+: 访问

: 等级

1093: 积分

42: 粉丝

26: 获赞

13: 评论

178: 收藏

私信

关注

分类专栏

最新评论

数据结构第一章:向量
好饿呀~～～: 清华大学，邓俊辉老师的课。
opencv学习（十七）dilate()膨胀函数//erode()腐蚀函数
white_lbw: 写的不错哦,欢迎回访我的博客哦
数据结构第一章:向量
qq_51549692: 请问这套课程的名字叫什么呢？
opencv学习（九）图像绘制DrawEllipse/ Drawpolygon/ DrawFilledCircle/ DrawFilledCircle/ Rectangle(无法识别标识符，待解
越甲八千: 找不到标识符，是因为你只声明了函数，但是没有定义，在编译阶段就不会生成对应的符号，于是在链接阶段找符号就找不到，结果报错：找不到标识符。 #include<iostream> #include<opencv2/opencv.hpp> using namespace cv; using namespace std; #define WINDOW_NAME1 "绘制图1" #define WINDOW_NAME2 "绘制图2" #define WINDOW_WIDTH 600 //定义窗口大小 string image = "C:\\Users\\asus\\Pictures\\Saved Pictures\\123.jpg"; void DrawEllipse(Mat img, double angle); void DrawFi1ledCirc1e(Mat img, Point center); int main() { Mat atomImage = Mat::zeros(WINDOW_WIDTH, WINDOW_WIDTH, CV_8UC3); Mat rookImage = Mat::zeros(WINDOW_WIDTH, WINDOW_WIDTH, CV_8UC3); //绘制椭圆 DrawEllipse(atomImage, 90); DrawEllipse(atomImage, 0); DrawEllipse(atomImage, 45); DrawEllipse(atomImage, -45); //绘制圆心 DrawFi1ledCirc1e(atomImage, Point(WINDOW_WIDTH / 2,WINDOW_WIDTH / 2)); imshow(WINDOW_NAME1, atomImage); waitKey(0); return 0; } void DrawEllipse(Mat img, double angle) { int thickness = 2; int lineType = 8; ellipse(img, Point(WINDOW_WIDTH / 2, WINDOW_WIDTH / 2
数据结构第一章:向量
我辈当自强: 同学，我们看的课程一样，握手

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。