Char-CNN
论文:Character-level Convolutional Networks for Text Classification
论文解读:
* 简书论文翻译
* 《Character-level convolutional networks for text classification》论文网络结构解读
论文源码:
* 基于字符的卷积神经网络实现文本分类(char-level CNN)-论文详解及tensorflow实现
* 字符级卷积神经网络(Char-CNN)实现文本分类–模型介绍与TensorFlow实现
* Pytorch实现
数据集下载:google网盘地址
本文是发表在NIPS2015上的论文,论文内容比较通俗易懂,因此不再赘述,可以参见上面提到的资源。文中提出CNN可以使用字符级别的原始信号进行文本分类任务训练,无语考虑文本语法和语义结构。当数据集规模大时,CNN无需考虑单词层面的意义(如语言的语法或语义),另外char-CNN对于异常字符和表情都能很好的处理。语言本质上就是由符号组成,相对于传统基于词粒度的CNN,char-CNN能更好的处理不同的语言。