神经网络故障排查

本文总结了深度学习中遇到的故障排查方法,包括损失值不提升、变量未训练、梯度消失和梯度爆炸、过拟合等问题,提供了如数据增强、权重初始化、正则化等解决策略,并强调了使用Tensorboard进行诊断和监控的重要性。
摘要由CSDN通过智能技术生成

1.前言

这里结合了我们的经验以及网上提供的一些资源,总结了在定位卷积神经网络系统问题时的一些方法。我们主要聚焦在利用深度神经网络实现的有监督学习。这里的实现默认是Python3.6 Tensorflow(TF)。

假设我们利用一个卷积神经网络来训练模型,然后评估的结果达不到我们的预期,下面的步骤将是定位问题和逐步提升我们模型的方法思想。首先先总结下在开始故障排除之前必须要做的事情,这些故障问题将按照常见程度进行排序,我们优先一起看看最常见的故障问题。

2. 在排查故障之前

下面是你在coding你的深度学习算法时的最佳实践。
1. 选择适合的日志和变量名称:在tensorflow中,你可以根据名字取跟踪不同的变量,并且在Tensorboard中可视化出来。最重要的是,每一步都保证你在跟踪相关参数,比如:step_number, accuracy, loss,learning_rate 等,以及更加专业的衡量指标(比如分词任务里的mean_intersection_over_union aka mean_iou 等)。
2. 保证你的网络是链路正确的:利用Tensorboard和其他 debugging 技术来保证你的计算图里每一个操作都有正确的输入和输出。并且要保证把训练数据和标签输入神经网络之前,要对数据做充分的预处理。
3. 运用数据增强技术:这个不常用,但是如果你是在处理图片的问题时,你将会看到当你运用数据增强技术时,比如:镜像,旋转,随机截取,缩放,添加噪声和弹性变形等ÿ

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值