tensorflow从入门到放弃再到精通(3.3):分类问题模型构建以及优化

本文深入探讨了使用Tensorflow构建分类模型的过程,包括如何解决线性模型的问题、提升模型表达能力以及优化方法。通过引入非线性激活函数如ReLU,以及堆叠神经网络层形成深度网络,增强模型的非线性表达能力。同时,讨论了随着网络复杂度增加,自动求导在深度学习优化中的关键作用。
摘要由CSDN通过智能技术生成

之前详细整理介绍了MNIST数据集,接下来详细介绍怎么构建模型

对于分类问题来讲,目标其实就是最大化某个性能指标,比如准确度,但是把精准度当作损失函数去优化的时候,其实是不可导的,不能使用梯度下降去优化参数。一般的做法是设立一个平滑可导的代理目标函数,比如优化模型的输出o和one-hot编码后的真是标签y之间的距离,通过优化代理目标函数得到的模型,测试性能上也能有良好的表现。 因此,相对回归问题而言,分类问题的优化目标函数和评价目标函数是不一致的。

对于分类问题的误差计算来说,更常见的是采用交叉熵(Cross Entropy)损失函数,较少采用回归问题中介绍的均方差损失函数。那我就便用均方差损失函数,采用梯度下降算法来优化损失函数得到𝑾, 𝒃的最优解,然后再利用模型去预测位置的手写数字模型。

可是这样真的能解决问题吗?目前看来,最少存在两个严重的问题:

线性模型 线性模型是机器学习中间最简单的数学模型之一,参数量少,计算简单,但 是只能表达线性关系。即使是简单如数字图片识别任务,它也是属于图片识别的范畴,如果只使用一 个简单的线性模型去逼近复杂的人脑图片识别模型,很显然不能胜任。

表达能力 表达能力体现为逼近复杂分布的能力,这个方案只是用了少量的神经元,表达能力偏弱。

如图:绘制了带观测误差的采 样点的分布

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值