深度学习之卷积神经网络CNN理论与实践详解

最新推荐文章于 2024-08-02 18:59:18 发布

LeadAI学院

最新推荐文章于 2024-08-02 18:59:18 发布

阅读量900

点赞数

六月北京 | 高性能计算之GPU CUDA培训

6月22-24日

640?wx_fmt=jpeg

三天密集式学习快速带你入门阅读全文 >

正文共1416个字，6张图，预计阅读时间6分钟。

概括

大体上简单的卷积神经网络是下面这个网络流程：

640?wx_fmt=jpeg

笼统的说：

文本通过Embeding Layer 后，再通过一些filters进行过滤，对结果进行maxPooling，再经过线性层映射到类别上，最后经过Softmax，得出类别分数。

细致的说：就得慢慢分析了，as follows：

第一层：将Embeding进行filter

设 Embeding大小为：EmbedSize

边解释专有名词边讲述过程：

Channel：每个单词的向量是上图的对应的行。这里的一个句子形成一个二维矩阵，这里二维矩阵叫做一个channel。

Filter：过滤器，有时候也叫做kernel。图片处理的filter大小可以根据情况选择不同的正方形的filter；而自然语言处理中，每行表示一个特征，不能分离，所以这里的filter的长为EmbedSize，而宽呢？一般设置为奇数3，4，5(这些都是经验值，当然可以设置成别的值，但是不推荐。宽为偶数的特别少见，一般不用）。这里的Filter在和计算的时候，是和Embeding矩阵对应位相乘，最后相加，得出一个结果，公式为y = W*X + b(有没有b，自己决定)最后随着滑动，得到一个新的矩阵。

Strides: 步长。也就是滑动的距离。无论向右滑动还是向下滑动都是这个大小。(因为这里的Filter长为EmbedSize，所以，这里只能向下滑动)

Filter后的输出矩阵大小为：(n-f+1)/s+1 * 1 其中n为句子的长度，f为Filter的宽，s为Stride。可以看出，不同的Filter对应的输出矩阵大小是不一样的。所以，提出Padding。

Padding：四周填充0。它的用途有两个：1.解决输出大小不一致的问题。2.解决信息丢失的问题（主要是角上的信息）。

所以这时候的矩阵输出为：(n-f+2p+1)/s+1 * 1(p为pooling大小)，一般默认s为1，所以为了使输出的矩阵高为n，则n-f+2p+1 = n

即：p = (f-1)/2 （f为一般为奇数，所以p = (f-1)//2）

这里在pytorch里的网络层代码：

640?wx_fmt=png

最后的矩阵记得要经过一个激活函数。

数据流动：

640?wx_fmt=jpeg

第二层 MaxPooling最大池化

有时候这个也说不算是一个层，因为不含参数。

将第一层得到的m个二维矩阵，进行maxPooling，最终变成m*1的矩阵。（m为相同Filter的个数*Filter种类）

数据流动代码：

640?wx_fmt=jpeg

第三层 Fully Connected Layer全连接层

将上面的m*1维的数据进过一个线性层，映射到k*1上。（k是种类个数）

再进行Softmax，得到最终分类。

这里在pytorch里的网络层代码：

640?wx_fmt=png

数据流动代码：

640?wx_fmt=jpeg

注：代码里没有Softmax，是因为之后用到的Loss函数里默认有。

ok,这里就讲完了。最近在想CNN好想不太适合做立场检测，觉得LSTM应该更为合适，接下来系统理论的学习下LSTM网络。

原文链接：https://mp.weixin.qq.com/s/2ciOVgGXWD6474yiB3uxWg

查阅更为简洁方便的分类文章以及最新的课程、产品信息，请移步至全新呈现的“LeadAI学院官网”：

www.leadai.org

请关注人工智能LeadAI公众号，查看更多专业文章

640?wx_fmt=jpeg

大家都在看

640.png?

LSTM模型在问答系统中的应用

基于TensorFlow的神经网络解决用户流失概览问题

最全常见算法工程师面试题目整理（一）

最全常见算法工程师面试题目整理（二）

TensorFlow从1到2 | 第三章深度学习革命的开端：卷积神经网络

装饰器 | Python高级编程

今天不如来复习下Python基础

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。