文本分类的一些建议

最新推荐文章于 2024-06-27 14:55:55 发布

jiangda_0_0

最新推荐文章于 2024-06-27 14:55:55 发布

阅读量937

点赞数

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jiangda_0_0/article/details/80258826

版权

机器学习同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

3 篇文章 0 订阅

订阅专栏

文本分类模型
- 常用的文本分类方法有，TF-IDF、Word2Vec、NB、SVM、LR、RNN、CNN等
- 传统的文本分类模型需要大量的特征工程，而基于神经网络的模型，通过向量化词语，可以省去大量的特征工程。往往有比较好的效果
- 使用RNN模型可以捕捉文本的上下文信息，CNN模型的效果受window大小的影响比较大，window的大小定义了模型的“视野”的大小，所以这里我们使用RNN模型，常见的实现有LSTM/GRU等
- 通常双向的RNN比单向的效果更好
- 由于地址的长度不是固定的，RNN模型可以选择动态的RNN或者padding句子长度后进入静态的RNN。动态的RNN的好处是输入的句子长度可以不固定；可以节省memory，可以长度长度不固定的语句。实验证明动态的RNN效果更好
- 一定要使用dropout， dropout的作用主要相当于做bagging，可以提升模型的泛化能力。通常0.5效果比较好
- 词向量的问题。Word2vec通常有两种方法。1.CBOW；2.skip-gram。对于大数据集，skip-gram效果更好
- 词向量加入训练模型的效果可以获得可观的提升
- 多任务loss之间的比例关系，主要靠调参来尝试解决
- fine tuning可以获得可观的提升
- 激活函数的选择，在某些情况下，比如学习步数太大的时候，可能会导致神经元的坏死，从而使得模型的效果有损失。在概率类的模型中使用tanh更好

三、线上模型

MultiTask
- 共享表示提高泛化能力
- 至于为什么MultiTask能够提高多个任务的效果，参考http://ruder.io/multi-task/
- 本任务中，由于前面的RNN部分主要为了获得一种泛化的地址向量化的表示方式，所以使用shared-layer方法
单层的RNN模型
- draw.io evaluation version
  
  Dense1:256
  
  LSTM-layer:1 (256)
  
  LSTM-layer:0 (256)
  
  output2:42
  
  output1:9
  
  Dense2:128
  
  Dense3:128
- 如图使用的为单向RNN
双向RNN模型
- draw.io evaluation version
  
  Dense1:512
  
  static-bi-directional-LSTM-layer:1 (256)
  
  static-bi-directional-LSTM-layer:0 (256)
  
  output2:42
  
  output1:9
  
  Dense2:256
  
  Dense3:256
- 如图使用的为静态的双向RNN，第二层LSTM输出为（-1，512）的shape的状态
TextRNN+CNN模型
- TextRNN+CNN的模型结构。其中convolutional-layer采用Bi-directional LSTM来实现。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
文本分类的一些建议

文本分类模型常用的文本分类方法有，TF-IDF、Word2Vec、NB、SVM、LR、RNN、CNN等传统的文本分类模型需要大量的特征工程，而基于神经网络的模型，通过向量化词语，可以省去大量的特征工程。往往有比较好的效果使用RNN模型可以捕捉文本的上下文信息，CNN模型的效果受window大小的影响比较大，window的大小定义了模型的“视野”的大小，所以这里我们使用RNN模型，常见的实现有LST...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。