nlp之文本屏蔽

NLP论文学习之 TextShield: Robust Text Classification Based on Multimodal Embedding and Neural Machine Translation

 

一、关键词学习:

 

1.   NLP

一文看懂NLP                            NLP~NLU+NLG

语料预处理---》设计模型---》训练模型

 

2.   NLU:自然语言理解

  • 意图识别
  • 实体提取

实现方式:基于规则,基于统计,基于深度学习

 

3.   NLG:自然语言生成

非语言格式的数据转换成人类可以理解的语言格式

  • 内容确定
  • 文本结构
  • 句子聚合
  • 语法化
  • 参考表达式生成
  • 语言实现

 

4.   LSTM

LSTM神经元加入了输入门,遗忘门,输出门和内部记忆单元

输入门:控制输入x和当前计算的状态更新到记忆单元的程度大小   i_{t}=\sigma \left ( W_{i}X_{t}+U_{i}h_{t-1}+b_{i} \right )

遗忘门:控制输入x和上一层隐藏层输出h被遗忘的程度大小        {\color{Red} }f_{t}=\sigma \left ( W_{f}X_{t}+U_{f}h_{t-1}+b^{_{f}}\right )

输出门:控制输入x和当前输出取决于当前记忆单元的程度大小   O_{t}=\sigma \left ( W_{o}X_{t}+U_{o}h_{t-1}+b_{o} \right )   h_{t}=o_{t}Tanh\left ( c_{t} \right )

 

5.   BiLSTM

BiLSTM介绍

不完全双向训练:模型前后分别训练

 

 

6.   CNN:卷积神经网络

看懂CNN

 

 

7.   NMT:神经机器翻译

基于神经网络的技术来实现更多上下文精确的翻译,而不是一次翻译一个单词的破碎句子。使用大型人工神经网络计算单词序列的概率,NMT将完整的句子放入一个集成模型中。

 

 

二、源码学习

源码链接:textshield

目录结构:

  • dist:页面渲染
  • docs:页面布局和渲染
  • docs:同docs,不同页面

 

src:核心代码

  • crypto:加密解密
  • encoding:编码格式
  • filter:过滤器

 

 

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值