深度学习和文本分类

https://blog.csdn.net/Ding_xiaofei/article/details/81132555

传统的文本分类模型

è¿éåå¾çæè¿°


深度学习文本分类模型
fasttext
fastText 模型输入一个词的序列(一段文本或者一句话),输出这个词序列属于不同类别的概率。 
序列中的词和词组组成特征向量,特征向量通过线性变换映射到中间层,中间层再映射到标签。 
fastText 在预测标签时使用了非线性激活函数,但在中间层不使用非线性激活函数。 
fastText 模型架构和 Word2Vec 中的 CBOW 模型很类似。不同之处在于,fastText 预测标签,而 CBOW 模型预测中间词。

这个模型本身是没有什么特别之处的,它就是利用词向量的平均来做分类。

è¿éåå¾çæè¿°

fastext本质上是一个分类模型,当然它也是可以产生词向量。不过多赘述。

textcnn


TextCNN详细过程:第一层是图中最左边的7乘5的句子矩阵,每行是词向量,维度=5,这个可以类比为图像中的原始像素点了。然后经过有 filter_size=(2,3,4) 的一维卷积层,每个filter_size 有两个输出 channel。第三层是一个1-max pooling层,这样不同长度句子经过pooling层之后都能变成定长的表示了,最后接一层全连接的 softmax 层,输出每个类别的概率。

特征:这里的特征就是词向量,有静态(static)和非静态(non-static)方式。static方式采用比如word2vec预训练的词向量,训练过程不更新词向量,实质上属于迁移学习了,特别是数据量比较小的情况下,采用静态的词向量往往效果不错。non-static则是在训练过程中更新词向量。推荐的方式是 non-static 中的 fine-tunning方式,它是以预训练(pre-train)的word2vec向量初始化词向量,训练过程中调整词向量,能加速收敛,当然如果有充足的训练数据和资源,直接随机初始化词向量效果也是可以的。

textrnn

è¿éåå¾çæè¿°
利用最后一个词的结果直接softmax,其实这里最后一个词已经包括了前面这些词的语义信息了。

TextRnn+attention

è¿éåå¾çæè¿°
textrcnn

è¿éåå¾çæè¿°

--------------------- 
作者:Ding_xiaofei 
来源:CSDN 
原文:https://blog.csdn.net/Ding_xiaofei/article/details/81132555 
版权声明:本文为博主原创文章,转载请附上博文链接!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值