机器学习之卷积神经网络--CNN介绍

卷积神经网络–CNN

1. 卷积神经网络介绍

卷积神经网络(Convolutional Neural Networks,CNN)是一种包
含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。
常见的CNN网络有LeNet-5、VGGNet、GoogleNet、ResNet、
DenseNet、MobileNet等。
CNN主要应用场景: 图像分类、图像分割 、 目标检测 、 自然语言处
理等领域。

2. 卷积神经网络基本结构及原理

卷积神经网络基本结构

在这里插入图片描述

CNN基本结构:INPUT -> 卷积->激活 -> 池化 -> 全连接 ->OUTPUT

卷积层

对输入的图像数据与卷积核做卷积运算提取图像的高阶特征
卷积过程的几个参数
1、深度(depth):卷积核个数,也称神经元个数,决定输出的特征图的数量。
在这里插入图片描述

2、步长(stride):卷积核滑动一次的大小,决定滑动多少步可以到达边缘。
在这里插入图片描述
在这里插入图片描述

3、填充值(padding):在外围边缘补充0的层数。

卷积过程

在这里插入图片描述

卷积网络最主要的两个特征
1、局部感知
2、权值共享
激活层、Relu函数

池化层

下采样(downsamples),对输入的特征图进行压缩;
一方面使特征图变小,简化网络计算复杂度,有效控制过拟合;
另一方面进行特征压缩,提取主要特征。
池化,规模一般为 2*2,操作一般有2种:

  • 最大池化(Max Pooling)。取4个点的最大值。这是最常用的池化方法。
  • 均值池化(Mean Pooling)。取4个点的均值。
  • 在这里插入图片描述

全连接层

连接所有的特征,将输出值送给分类器,实现分类。
在这里插入图片描述

3. pytorch中卷积的实现

卷积层

torch.nn.Conv2d()
参数说明
in_channels:输入通道数(深度)
out_channels:输出通道数(深度)
kernel_size:滤波器(卷积核)大小
stride:表示滤波器滑动的步长
padding:是否进行零填充
bias:默认为 True,表示使用偏置
groups:控制分组卷积,默认不分组,为1组。
dilation:卷积对输入的空间间隔,默认为 True

激活层

torch.nn.ReLU()
参数说明
inplace:是否在原数据进行操作,默认是False

池化层

torch.nn.MaxPool2d()
torch.nn.AvgPool2d()
参数说明
kernel_size :表示做最大池化的窗口大小
stride:步长
padding:是否进行零填充
dilation:卷积对输入的空间间隔,默认为 True

全连接层

torch.nn.Linear()
参数说明
in_features :输入特征数;
out_features:输出特征数;
bias:默认为 True,表示使用偏置

4. 经典卷积神经网络介绍

Lenet-5

LeNet5卷积神经网络源于Yann LeCun在1998年发表的论文:Gradient-
based Learning Applied to Document Recognition,是一种用于手写数字识别的
卷积神经网络。
LeNet-5是CNN网络架构中最知名的网络模型,是卷积神经网络的开山之
作。

AlexNet

2012 年, AlexNet 横空出世。AlexNet 使⽤卷积神经⽹络,并以很⼤的优
势赢得了ImageNet 2012 图像识别挑战赛冠军。
Alexnet模型由5个卷积层和3个池化Pooling 层 ,其中还有3个全连接层构
成。AlexNet 跟 LeNet 结构类似,但使⽤了更多的卷积层和更⼤的参数空间来拟
合⼤规模数据集 ImageNet。它是浅层神经⽹络和深度神经⽹络的分界线。

cifar10数据介绍

CIFAR-10 是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一
个用于识别普适物体的小型数据集。一共包含 10 个类别的 RGB 彩色图 片:飞
机( a叩lane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿
( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车
( truck )。图片的尺寸为 32×32 ,数据集中一共有 50000 张训练圄片和
10000 张测试图片在这里插入图片描述

VGGNet

VGGNet 是由牛津大学视觉几何小组(Visual Geometry Group, VGG)提
出的一种深层卷积网络结构,他们以 7.32% 的错误率赢得了 2014 年 ILSVRC 分
类任务的亚军。
VGGNet探索了卷积神经网络的深度与其性能之间的关系,成功地构筑了
16~19层深的卷积神经网络,证明了增加网络的深度能够在一定程度上影响网络
最终的性能,使错误率大幅下降,同时拓展性又很强,迁移到其它图片数据上的
泛化性也非常好。到目前为止,VGG仍然被用来提取图像特征。
VGG可以看成是加深版本的AlexNet。都是conv layer + FC layer

GoogleNet

GoogleNet是2014年Google团队提出的一种全新的深度学习结构,赢得了
2014 年 ILSVRC 分类任务的冠军。
GoogLeNet是第一个使用并行网络结构的经典模型,这在深度学习的发展
历程中是具有开创性意义的。
GoogLeNet最基本的网络块是Inception,它是一个并联网络块,经过不断
的迭代优化,发展出了Inception-v1、Inception-v2、Inception-v3、Inception-v4、
Inception-ResNet共5个版本。
Inception家族的迭代逻辑是通过结构优化来提升模型泛化能力、降低模型
参数。

ResNet

ResNet(残差网络) 网络是在 2015年 由微软实验室中的何凯明等几位大神
提出,斩获当年ImageNet竞赛中分类任务第一名,目标检测第一名。获得COCO
数据集中目标检测第一名,图像分割第一名。
它使用了一种连接方式叫做“shortcut connection”,顾名思义,shortcut就
是“抄近道”的意思。在这里插入图片描述
ResNet block有两种,一种两层结构,一种三层结构在这里插入图片描述

MobileNet

MobileNet是谷歌在2017年提出,专注于移动端或者嵌入式设备中的轻量
级CNN网络。
MobileNet的基本单元是深度可分离卷积,其可以分解为两个更小的操作:
depthwise convolution和pointwise convolution。

  • 4
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 电影评论情感分类是一项重要的自然语言处理任务,旨在自动将电影评论分为正面或负面情感。为了解决这个问题,研究人员已经开发了各种机器学习模型,其中卷积神经网络text-cnn是一种有效的模型。 TensorFlow是一个强大的深度学习库,提供了text-cnn模型的实现。text-cnn模型由多个卷积层和全局最大池化层组成,每个卷积层用于提取文本中的特定特征,而全局最大池化层则用于提取最具代表性的特征。最终,这些特征将被用于分类任务,通过一个全连接层来实现。 与其他情感分类模型相比,text-cnn模型具有许多优点。首先,它可以自适应不同长度的文本输入,并且不需要手动提取特征。其次,text-cnn模型具有较高的分类准确率,并且可以在大规模数据上进行训练,以提高其性能。最后,TensorFlow提供了一个简单的接口来实现text-cnn模型,并且提供了丰富的调试和可视化工具,使得模型的训练和评估变得更加容易。 总之,卷积神经网络text-cnn模型是一种高效、准确的情感分类模型,结合TensorFlow库的支持,可以有效地应用于电影评论等自然语言处理任务中。 ### 回答2: 电影评论情感分类是一类自然语言处理任务,它的目标是对一段文本进行情感分类,预测这段文本表达的情感是正面的(positive)还是负面的(negative)。在实践中,卷积神经网络CNN)已经被广泛应用于情感分类,其中text-cnn模型是最常用的一种。 Text-cnn模型在情感分类任务中的表现优秀,它将文本看作是一种二维结构,其中一个维度是词语,另一个维度是嵌入矩阵中的向量。文本中的词被编码为嵌入向量,并且这些嵌入向量被视为图像的像素。在text-cnn模型中,多个不同大小的卷积核被用来通过卷积操作提取出文本的局部特征。这些局部特征被压缩成一个全局特征向量,并通过一个全连接层进行分类器预测。 TensorFlow是实现text-cnn模型的流行工具之一,它是一个开源的机器学习框架,提供了广泛的API和工具来创建高效的深度学习模型。TensorFlow可以轻松地构建text-cnn模型,而且具有内置的优化器和损失函数,它可以加速模型训练和优化。 总的来说,text-cnn模型是一个强大的情感分类器,它已经在几个领域得到了成功的应用。在使用TensorFlow实现text-cnn模型时,需要注意模型的超参数调整,以及数据预处理和特征工程的优化,这些都可以影响模型的性能和泛化能力。 ### 回答3: 电影评论情感分类是NLP领域的一个基础应用问题,通过对文本进行情感分类可以帮助我们更好地理解用户心理、市场需求等诸多方面。卷积神经网络(CNN)是目前NLP领域应用广泛的深度学习算法,它能够对输入的多维矩阵进行特征提取,逐层降维,最终将特征表示为一维向量。 Text-CNNCNN在NLP领域的应用,它主要通过卷积层和池化层对文本进行特征提取和降维。卷积层通过提取矩阵中的局部特征,池化层通过按照一定的规则对特征进行采样,最终形成一个固定长度的向量作为文本的表示。在情感分类任务中,Text-CNN可以通过对输入的文本进行卷积和池化操作,得到文本的固定长度特征向量,进而输出文本的情感类别。 TensorFlow是当前最受欢迎的深度学习框架之一,它提供了丰富的API和工具,能够方便地构建并训练Text-CNN模型。在构建Text-CNN模型时,首先需要进行文本的预处理,将文本转换为数字表示,然后使用TensorFlow对模型进行定义和训练。 总之,电影评论情感分类是NLP领域一个重要的应用问题,采用Text-CNN模型可以准确有效地对文本进行情感分类,而TensorFlow提供了一个便捷的框架和工具,用于构建和训练Text-CNN模型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

南蓬幽

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值