A Radical-Aware Attention-Based Model for Chinese Text Classification提高中文文本分类的算法

提出了一种基于注意的四粒度模型(RAFG),该模型充分利用了汉字、词、字级词根的特点。采用了一种序列化的BLSTM结构,该结构具有上下文感知能力,能够捕获远程信息,对中文字符共享属性和文本序列特征进行建模

输入层:特征(字)

              词

并且得到两种词根级特征:

 

英文符号和标点都表示为“-”

 嵌入层:

将汉字,词以及其词根级特征分别表示为嵌入矩阵

 E^{c} E^{w} E^{R^c} E^{R^w}

 表示层:

给定句子x的emdedding:

隐藏层: 

 \overrightarrow{h_t}\overleftarrow{h_t}是隐藏层的前向和后向隐向量 y_t是两者的串联,表示为隐藏层的输出

设计了一种能够捕捉偏旁与其对应字词之间相互关系的注意机制

每一个输出Y{^c}Y{^w}分别和e{^r}{^c} e{^r}{^w}做内积

 

 得到新的embedding,带有注意力。

预测层:

 将BLSTM^r^cBLSTM^r^w的输出连接起来为Con输入到全连接层

 

模型训练:

 

 运用交叉熵损失函数 T是输出的文本,Corpus为语料库,K表示类别数

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值