神经网络训练技巧

最新推荐文章于 2024-03-20 18:32:36 发布

德宇deyu

最新推荐文章于 2024-03-20 18:32:36 发布

阅读量262

点赞数 2

分类专栏：统计机器学习文章标签：机器学习神经网络 matlab

本文链接：https://blog.csdn.net/u013745764/article/details/97612204

版权

1 篇文章 0 订阅

订阅专栏

写作初衷

最近帮朋友解决神经网络训练遇到的一些问题，结合在吴恩达老师课程中学到的技巧，梳理一下神经网络学习的一些技巧和陷阱。

编号	问题	描述
1	运行好多次才能得到最优解	利用R语言的机器学习包；没有收敛就结束；输出结果精度很低；预测的很多都错的
2	调参的环节，比其他分类器要用的时间多些	R语言机器学习包

神经网络学习有其一般的过程。

1 参数的随机初始化

2 实现前向传播计算每个样本对应的输出节点激活函数值

3 实现代码计算损失函数

4 实现反向传播计算偏导数

5 数值计算梯度来进行梯度检查，以判断偏导数计算的正确性。如果正确就取消掉梯度检查。

6 使用梯度下降或者先进的优化方法结合反向传播来最小化 J(theta)，其中 J(theta)是关于theta的函数

// 反向传播计算的向量化伪代码
for i = 1:m // 遍历每个样本 
	code-使用当前样本进行前向传播和反向传播计算，得到网络每一层的激活函数值a(l) 和delta(l)值
	△(l) = △(l) + delta(l)(a(l))'
endfor
code-计算偏导数

通过不断询问问题的细节，总结为一下两个问题：

解答不一定对，欢迎大佬们批评指正。

关注

专栏目录