tensorflow学习笔记----当多分类问题遇见softmax

在tensorflow模型中通常会涉及二分类以及多分类问题。

对于传统的二分类问题,我们可以设定输出层只有一个节点,设定阈值确定待预测样本的分类。(例如如下判断零件是否合格的神经网络结构)

但是对于多分类问题时,我们的输出层节点数通常设定与分类种类数目相同,面对多个输出节点的情况,我们同样可以设定多个阈值的办法实现分类,然而这种分类方法不够灵活,当我们的模型还未接近极优时,这种分类方法通常会失效,比如在阈值之间出现两个符合情况的输出。对此,我们可以运用softmax方法很好的解决多分类问题。

我们先来直观看一下,Softmax究竟是什么意思:

我们知道max,假如说我有两个数,a和b,并且a>b,如果取max,那么就直接取a,没有第二种可能,但有的时候我不想这样,因为这样会造成分值小的那个饥饿。所以我希望分值大的那一项经常取到,分值小的那一项也偶尔可以取到,那么我用softmax就可以了 现在还是a和b,a>b,如果我们取按照softmax来计算取a和b的概率,那a的softmax值大于b的,所以a会经常取到,而b也会偶尔取到,概率跟它们本来的大小有关。(转载)(详解softmax数学推导过程)下面结合代码感受一下softmax。

import tensorflow as tf
a = tf.constant([  -1.0 ,  0 ,  1.0 ,   2.0 ,  3.0  ])
a_softmax = tf.nn.softmax(logits)
with tf.Session() as sess:
    print(sess.run(y))

输出结果:

[0.01165623 0.03168492 0.08612854 0.23412165 0.6364086 ]

可以看出softmax可以根据大小计算出每一个输出在总输出的概率,从而确定分类,同时,在我们训练中,通常提供的label信息为(以mnist 数字2为例)[ 0 , 0 ,1,0,0,0,0,0,0,0]  ,使用softmax处理输出层可以使我们更好定义损失函数。

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,下面是基于 TensorFlow 使用 LeNet-5 实现对 MNIST 手写数字识别分类的步骤: 1. 安装 TensorFlow:可以通过 pip 安装,命令为 `pip install tensorflow`。 2. 导入必要的库: ``` import tensorflow as tf from tensorflow.keras import datasets, layers, models ``` 3. 加载 MNIST 数据集: ``` (train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data() ``` 4. 对数据进行预处理: ``` train_images = train_images.reshape((60000, 28, 28, 1)) test_images = test_images.reshape((10000, 28, 28, 1)) train_images, test_images = train_images / 255.0, test_images / 255.0 ``` 5. 构建 LeNet-5 模型: ``` model = models.Sequential() model.add(layers.Conv2D(6, (5, 5), activation='relu', input_shape=(28, 28, 1))) model.add(layers.MaxPooling2D((2, 2))) model.add(layers.Conv2D(16, (5, 5), activation='relu')) model.add(layers.MaxPooling2D((2, 2))) model.add(layers.Flatten()) model.add(layers.Dense(120, activation='relu')) model.add(layers.Dense(84, activation='relu')) model.add(layers.Dense(10, activation='softmax')) ``` 6. 编译模型: ``` model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) ``` 7. 训练模型: ``` model.fit(train_images, train_labels, epochs=5, validation_data=(test_images, test_labels)) ``` 8. 测试模型: ``` test_loss, test_acc = model.evaluate(test_images, test_labels) print('Test accuracy:', test_acc) ``` 以上就是基于 TensorFlow 使用 LeNet-5 实现对 MNIST 手写数字识别分类的步骤。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值