keras 生成句子向量 词向量_GitHub - bulong/nlp_xiaojiang: XLNET句向量-相似度(text xlnet embedding),自然语言处理(nlp),闲聊机器人...

该项目包含了使用Keras和BERT、XLNet进行句向量生成,以及文本相似度计算的方法。包括回译、EDA等数据增强技术,以及检索式和生成式ChatBot的实现。此外,还涉及了分类任务,如 Bert+Bi-LSTM 在智能客服问题匹配中的应用。还提供了命名实体识别模型和数据预处理工具。
摘要由CSDN通过智能技术生成

nlp_xiaojiang

AugmentText

- 回译(效果比较好)

- EDA(同义词替换、插入、交换和删除)(效果还行)

- HMM-marko(质量较差)

- syntax(依存句法、句法、语法书)(简单句还可)

- seq2seq(深度学习同义句生成,效果不理想,seq2seq代码大都是 [https://github.com/qhduan/just_another_seq2seq] 的,效果不理想)

ChatBot

- 检索式ChatBot

- 像ES那样直接检索(如使用fuzzywuzzy),只能字面匹配

- 构造句向量,检索问答库,能够检索有同义词的句子

- 生成式ChatBot(todo)

- seq2seq

- GAN

ClassificationText

- bert+bi-lstm(keras) approach 0.78~0.79% acc of weBank Intelligent Customer Service Question Matching Competition

- bert + text-cnn(keras) approach 0.78~0.79% acc of weBank Intelligent Customer Service Question Matching Competition

- bert + r-cnn(keras) approach 0.78~0.79% acc of weBank Intelligent Customer Service Question Matching Competition

- bert + avt-cnn(keras) approach 0.78~0.79% acc of w

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值