keras 生成句子向量 词向量_GitHub - see-u-see/nlp_xiaojiang: 自然语言处理(nlp),闲聊机器人(chatbot),BERT句向量-相似度(Sentence S...

该项目包含使用Keras进行自然语言处理的各种实践,包括句子向量生成、BERT模型应用、聊天机器人的实现。重点在于通过BERT提取句子特征,用于文本分类和相似度计算,并探讨了数据增强技术。此外,还提供了检索式和生成式ChatBot的实现以及相关工具和数据集。
摘要由CSDN通过智能技术生成

nlp_xiaojiang

AugmentText

- 回译(效果比较好)

- EDA(同义词替换、插入、交换和删除)(效果还行)

- HMM-marko(质量较差)

- syntax(依存句法、句法、语法书)(简单句还可)

- seq2seq(深度学习同义句生成,效果不理想,seq2seq代码大都是 [https://github.com/qhduan/just_another_seq2seq] 的,效果不理想)

ChatBot

- 检索式ChatBot

- 像ES那样直接检索(如使用fuzzywuzzy),只能字面匹配

- 构造句向量,检索问答库,能够检索有同义词的句子

- 生成式ChatBot(todo)

- seq2seq

- GAN

ClassificationText

- bert+bi-lstm(keras) approach 0.78~0.79% acc of weBank Intelligent Customer Service Question Matching Competition

- bert + text-cnn(keras) approach 0.78~0.79% acc of weBank Intelligent Customer Service Question Matching Competition

- bert + r-cnn(keras) approach 0.78~0.79% acc of weBank Intelligent Customer Service Question Matching Competition

- bert + avt-cnn(keras) approach 0.78~0.79% acc of w

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值