论文Character-level Convolutional Networks for Text Classification中提出了Char-CNN来做文本分类。
Char-CNN首先制作字符表,对应把字符转换成one-hot向量,于是一个句子就转换成了字符one-hot向量构成的向量矩阵,然后经过多个卷积层、池化层和全连接层进行分类。
个人感觉论文中对模型细节的描述实在太精简了,去翻了好几个github上的高票项目代码才把模型结构理清楚,提出的模型包括6个卷积层和3个全连接层,详细信息如下:
卷积层:
全连接层:
Large Feature/Small Feature:卷积核的个数;
Kernal:卷积核的宽度,就是一次计算的字符个数