tensorflow从入门到放弃再到精通(3.3):分类问题模型构建以及优化

最新推荐文章于 2024-07-14 10:46:35 发布

聪明的小k

最新推荐文章于 2024-07-14 10:46:35 发布

阅读量356

点赞数

分类专栏：深度学习文章标签： tensorflow 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuanzhuanguo/article/details/104931548

版权

本文深入探讨了使用Tensorflow构建分类模型的过程，包括如何解决线性模型的问题、提升模型表达能力以及优化方法。通过引入非线性激活函数如ReLU，以及堆叠神经网络层形成深度网络，增强模型的非线性表达能力。同时，讨论了随着网络复杂度增加，自动求导在深度学习优化中的关键作用。

摘要由CSDN通过智能技术生成

之前详细整理介绍了MNIST数据集，接下来详细介绍怎么构建模型

对于分类问题来讲，目标其实就是最大化某个性能指标，比如准确度，但是把精准度当作损失函数去优化的时候，其实是不可导的，不能使用梯度下降去优化参数。一般的做法是设立一个平滑可导的代理目标函数，比如优化模型的输出o和one-hot编码后的真是标签y之间的距离，通过优化代理目标函数得到的模型，测试性能上也能有良好的表现。因此，相对回归问题而言，分类问题的优化目标函数和评价目标函数是不一致的。

对于分类问题的误差计算来说，更常见的是采用交叉熵(Cross Entropy)损失函数，较少采用回归问题中介绍的均方差损失函数。那我就便用均方差损失函数，采用梯度下降算法来优化损失函数得到𝑾, 𝒃的最优解，然后再利用模型去预测位置的手写数字模型。

可是这样真的能解决问题吗？目前看来，最少存在两个严重的问题：

线性模型线性模型是机器学习中间最简单的数学模型之一，参数量少，计算简单，但是只能表达线性关系。即使是简单如数字图片识别任务，它也是属于图片识别的范畴，如果只使用一个简单的线性模型去逼近复杂的人脑图片识别模型，很显然不能胜任。

表达能力表达能力体现为逼近复杂分布的能力，这个方案只是用了少量的神经元，表达能力偏弱。

如图：绘制了带观测误差的采样点的分布

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。