人工智能练习题:激活函数需要满足的条件、提高CNN的泛化能力、CNN输出特征图大小计算

第一次用ChatGPT,不得不说在处理大学生作业上,ChatGPT比国内的作业软件好用多了(感叹)

1.激活函数需要满足的条件

通常情况下,激活函数需要满足下面两个条件:

  • 非线性:激活函数需要是非线性函数,否则就相当于是一层线性变换,不能表达复杂的函数关系。
  • 可导性或近似可导性:梯度下降算法是常用的训练神经网络的方法,因此激活函数应当是可导的,或者至少是近似可导的。

根据上述条件,下列的函数不能作为激活函数:

  • f(x)=x:这是线性函数,不满足非线性的条件。
  • f(x)=|x|:这是非连续函数,不满足可导的条件。

2.提高CNN泛化能力的方法

训练CNN时,可以对输入进行旋转、平移、缩放等预处理提高模型泛化能力。这么说是对,还是不对?

对的。在训练卷积神经网络(CNN)时,可以对输入进行旋转、平移、缩放等预处理来提高模型的泛化能力。这种预处理技术称为数据增强(data augmentation),可以增加训练集的多样性,提高模型的鲁棒性和泛化能力,降低过拟合的风险。

通过旋转、平移、缩放等操作,可以生成与原始图像具有不同变换的新图像。这些新图像包含了更多的样本和多样性,可以帮助模型更好地学习特征,并且能够提高模型对于输入变化的适应能力。此外,数据增强可以有效地扩充训练集的大小,从而减少模型的过拟合。

因此,在实际应用中,数据增强已成为卷积神经网络训练的常用技术。

3.CNN输出特征图大小计算

输入图片大小为200×200,依次经过一层卷积(kernel size 5×5,padding 1,stride 2),pooling(kernel size 3×3,padding 0,stride 1),又一层卷积(kernel size 3×3,padding 1,stride 1)之后,输出特征图大小为(C)。

A.95
B.96
C.97
D.98

解答

输入图片大小为200×200,经过第一层卷积后,特征图大小为:

Kernel size: 5x5
Padding: 1
Stride: 2
输出特征图大小为:

Height: (200 + 2 * 1 - 5) / 2 + 1 = 99
Width: (200 + 2 * 1 - 5) / 2 + 1 = 99
经过池化层后,特征图大小为:

Kernel size: 3x3
Padding: 0
Stride: 1
输出特征图大小为:

Height: (99 - 3) / 1 + 1 = 97
Width: (99 - 3) / 1 + 1 = 97
经过第二层卷积后,特征图大小为:

Kernel size: 3x3
Padding: 1
Stride: 1
输出特征图大小为:

Height: (97 + 2 * 1 - 3) / 1 + 1 = 97
Width: (97 + 2 * 1 - 3) / 1 + 1 = 97
因此,最终输出的特征图大小为 97x97。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值