Text-CNN模型来进行文本分类

最新推荐文章于 2024-08-21 11:23:21 发布

colorful_-_

最新推荐文章于 2024-08-21 11:23:21 发布

阅读量325

点赞数

分类专栏： NLP 文章标签： Text-CNN 文本分类

本文链接：https://blog.csdn.net/weixin_43589681/article/details/90521348

版权

NLP 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1 .结构
在这里插入图片描述
2.参数与超参数
sequence_length
Q: 对于CNN, 输入与输出都是固定的，可每个句子长短不一, 怎么处理?
A: 需要做定长处理, 比如定为n, 超过的截断, 不足的补0. 注意补充的0对后面的结果没有影响，因为后面的max-pooling只会输出最大值，补零的项会被过滤掉.
num_classes
多分类, 分为几类.
vocabulary_size
语料库的词典大小, 记为|D|.
embedding_size
将词向量的维度, 由原始的 |D| 降维到 embedding_size.
filter_size_arr
多个不同size的filter

3.Embedding Layer
通过一个隐藏层, 将 one-hot 编码的词投影到一个低维空间中.
本质上是特征提取器，在指定维度中编码语义特征. 这样, 语义相近的词, 它们的欧氏距离或余弦距离也比较近.

4.Convolution Layer
为不同尺寸的 filter 都建立一个卷积层. 所以会有多个 feature map.
图像是像素点组成的二维数据, 有时还会有RGB三个通道, 所以它们的卷积核至少是二维的.
从某种程度上讲, word is to text as pixel is to image, 所以这个卷积核的 size 与 stride 会有些不一样.
在这里插入图片描述
5.Max-Pooling Layer
max-pooling只会输出最大值, 对输入中的补0 做过滤.