tensorflow总结

最新推荐文章于 2023-01-03 18:46:12 发布

qq_32110859

最新推荐文章于 2023-01-03 18:46:12 发布

阅读量268

点赞数

分类专栏： tensorflow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32110859/article/details/82685888

版权

tensorflow 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

最近的工作主要围绕tensorflow分布式（ps-worker，horovod）的改造，连最基本的模型搭建以及损失函数等都忘记了。出了问题都不知道该从何查起，做如下总结。

一、目前遇到的问题：

imagenet 数据集训练alexnet模型，模型loss输出一直固定在6.9左右。已经查过以下问题。

模型的参数随着训练过程在变化
1. 将模型输入设置为全白图片，检查模型输出logits，logits是在变化
2. 这里面发现自己的问题：对于损失函数，以及top函数的输入logits的定义理解不强。对于是否经过softmax处理不明确。
模型的输入数据是否正确
1. 将模型输入的图片写入txt文件，用plt画出来，发现图片是对的。
2. 这里面发现自己的问题：对于图片预处理的把握不强，只是人云亦云的拿了别人的预处理函数，出现问题发现还是要按照自己的理解写程序。

二、问题疑似解决：

组内博士大神指点迷津，说降低学习率。

之前的学习率是0.1和0.01，目前改到0.0001，loss开始下降，模型开始训练。等模型跑的论述多一点，看情况是否持续。

三、总结

1.当模型训练loss不变时，第一步还是要改变LR或是OPT，当LR调小到一定程度后，确定不是LR过大后，在开始检查模型参数是否变化以及输入数据是否正确。

2.要对深度学习基本概念以及原理有一定总结，对于分类问题的loss，top1，top5等需要明确。要多读tensorflow源码，确定哈数对于各个input的要求（数据格式，数据类型）以及各个参数的含义。尤其是源码中对于各个函数的注释，里面大多列举了对于input的要求。

3.遇到问题多和别人交流，一个人看问题，容易陷入局部最优。这几天在解决问题的过程中，总是跳过最基本的检查点，这是不对的，也在无形之间走了很多弯路，并且要尽量心平气和的和别人交流。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
tensorflow总结

最近的工作主要围绕tensorflow分布式（ps-worker，horovod）的改造，连最基本的模型搭建以及损失函数等都忘记了。出了问题都不知道该从何查起，做如下总结。一、目前遇到的问题： imagenet 数据集训练alexnet模型，模型loss输出一直固定在6.9左右。已经查过以下问题。模型的参数随着训练过程在变化将模型输入设置为全白图片，检查模型输出l...
复制链接

扫一扫

专栏目录

qq_32110859 CSDN认证博客专家 CSDN认证企业博客

码龄9年

34: 原创

62万+: 周排名

37万+: 总排名

2万+: 访问

: 等级

585: 积分

2: 粉丝

8: 获赞

6: 评论

12: 收藏

私信

关注

热门文章

分类专栏

最新评论

opencv读入图像自动旋转的问题
qq_32110859 回复 Hellow_RMB: 您好，我这边没有的。
opencv读入图像自动旋转的问题
Hellow_RMB: 博主，您好，你有类似于链接的C++代码嘛？
tf.image.resize_bilinear vs cv2.resize
qq_32110859 回复 asd5768878: 这样是一个思路，我认为只要在训练数据，验证数据，以及最后做inference时，用的是一样的处理方法就可以了。我们强制采用opencv是因为做inference时，用tf.image处理图片耗时长，需要ja用va在pb文件以外做，以减少耗时。
tf.image.resize_bilinear vs cv2.resize
asd5768878 回复 qq_32110859: 没事，起码知道解决方向了。我目前的处理方式，是把训练时对数据的处理方式应用到要测试的图片上，即对测试图片应用tf.image.resize_image()这个函数，不过需要额外多跑一个sess，大概多花费0.2秒。
tf.image.resize_bilinear vs cv2.resize
qq_32110859 回复 asd5768878: 用opencv实现了相应的数据处理功能，然后用tf.py_func()调用了相应的函数。我这边测试下来，opencv和tf.image耗时是差不多的。本来想把代码粘给你，但始终弄不对，不好意思~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。