Andrew机器学习课程笔记（2）——神经网络、机器学习Tips

最新推荐文章于 2020-12-18 23:28:22 发布

zizi7

最新推荐文章于 2020-12-18 23:28:22 发布

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zizi7/article/details/47658311

版权

机器学习专栏收录该内容

44 篇文章 0 订阅

订阅专栏

神经网络

梯度检验

有时由于一些不易觉察的错误，梯度下降算法虽然代价在减小，但最终可能达不到最优解。因此在测试刚建立的模型时，还可以引入梯度检验来确定每个参数在网络中的导数（梯度）是不是正常。

梯度检验方法很简单：在代价函数上沿着切线方向选择两个很近的点，求两个代价的平均（导数定义）。

权重初始化

对于LR算法，权重初始化为0是可行的；但在神经网络中，如果初始权重都相同（包括全为0的情况），将导致后面层的神经元输出也相同。

因此对于神经网络，合理的方式是对所有权重随机赋值。

输出

每个输出层的神经元，其结果是 [0,1] ，因此该层神经元数 == 类别数。

隐含层

隐含层越多精度越高（但要考虑随之而来的复杂度上升的情况及过拟合的可能），对于多个隐含层的情况，一般每层的神经元数目相等。

机器学习Tips

当算法精度不高时，该如何调整？

数据的分布

图1. 推荐的数据分布（图片来源：andrew课程视频）

假设设计了10个模型，用 train set 训练，用 cv set 筛选出最优的模型，用 test set 得到该模型的推广精度（如果既用 test set 选模型，又用其报告精度，会有过拟合的嫌疑，精度不可信）。

欠拟合与过拟合的判定

比较 train error 与 cv error

图2. 欠拟合 OR 过拟合（图片来源：andrew课程视频）

很好理解，若 train error 与 cv error 都较高，则为欠拟合；若 train error 较低而 cv error 较高，则为过拟合。

训练集大小的选择

通过对模型是否为欠拟合还是过拟合来做决定

图3. 训练集大小的选择（图片来源：andrew课程视频）

上图左是欠拟合，右是过拟合的情况。也很好理解，欠拟合其实就是模型太简单，这时增加 train set 也没什么作用；过拟合就是模型较复杂，而目前的样本过于集中或数目太少，因此增加 train set 会有提升。

正负样本比例失衡的情况

在实际中这种情况很常见，需要预测的正样本往往是小概率事件。

假设算法对所有样本都输出 0 （占大概率的事件），那么其精度是很高的，但我们都知道，然并卵。。。

因此需要另外的准则来评估该算法的精度

图4. 查准率和差全率

查准率(Precision) = TP / ( TP + FP )

查全率(Recall) = TP / (TP + FN)

这样，上面假设的Recall为0

一般希望模型在这2个指标上的表现尽可能均衡：MAX[ ( Precision*Recall )/(Precision+Recall) ]

总结

1. 对过拟合模型，可以考虑：增加训练样本、减少特征、提高正则化参数lambda

2. 对欠拟合模型，可以考虑：增加特征、提高模型复杂度、降低lambda

3. 从简单的算法开始，先把模型搭建好，通过模型分析来修正思路

4. 画出学习曲线，对交叉验证集的误差做分析

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Andrew机器学习课程笔记（2）——神经网络、机器学习Tips

对机器学习课程中神经网络与机器学习架构的内容做的笔记
复制链接

扫一扫

专栏目录

博客等级

码龄13年

143
原创

237
点赞

985
收藏

338
粉丝

关注

私信

热门文章

分类专栏

最新评论

[图像拼接]APAP算法及相关问题研究
最爱c语言: 是不是又被CSDN自动添加成会员了
KITTI双目数据集使用
Amber_YYANG: 平移的话为什么不是t3-t2呢
[图像拼接]APAP算法及相关问题研究
名を偏屈な炎: 需要全局确定画布大小吧
卷积神经网络全连接层转换为卷积层获得heatmap
weixin_45102734: 您好，我想请教两个问题。第一，转换为卷积层之后，图片通过网络得到 heatmap 中，每个坐标点已经是对应的227*227图片的一个类了嘛，不需要进行别的操作嘛。如果按通道数将其分开，会不会得到每一类的heatmap.. 第二对于训练好的网络，将全连接转为卷积层，直接修改模型嘛。那参数怎么办？您有时间，麻烦您看一看，谢谢
最大稳定极值区域（MSER）检测
诺帆: 您好，mser区域拟合在opencv中不需要求椭圆参数了吗，我看着最终结果就是一个个椭圆

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。