Nvidia最新基于大规模知识库文本预测模型原理(文本知识内涵)

NVIDIA推出Megatron-CNTRL AI语言模型框架,该框架允许在文本训练中融入大规模知识库,提高翻译和生成文本的精度与内涵。通过关键词预测、知识检索、相关性排序和文本生成四个步骤,模型能够为金融等专业领域提供准确且富含知识的文本摘要。
摘要由CSDN通过智能技术生成

资讯-----关注订阅专栏,实时获得最新一手解读微软/NVIDIA等最新AI算法模型原理设计与AI落地产业应用
与世界AI同步前行——————————

NVIDIA基于大规模知识库的大规模文本生成训练模型

与普通的文本摘要技术/机器翻译模型(seq2seq)不同,要训练具有广泛内容要义的文本,精确的表达文本主题的意思,包含知识解释融合在内的模型,需要针对输入文本,借助大规模知识文库,进行文本中词汇的知识检索,譬如金融常用文本中涉及的并购/拆借/股权融资等专业知识领域,如何翻译或生成符合金融场景和内涵的文本至关重要,对于生成结果的质量和可解释性。

那么如何把大规模的知识库加入到文本训练模型中,提高翻译与生成文本的精度/内涵呢?

最新NVIDIA技术团队研究推出适用于该场景训练的模型Megatron-CNTRL AI语言模型框架:该框架有效解决了文本加入知识库,可手工调节文本生成与知识库融合生成的训练过程。

核心应用模型与设计机制原理:
GPT2
BERT模型
keyword generator
related contextrual knowledge rank generator
sentence  generator

下面我们来一图看懂整个原理模型框架的设计逻辑和思路:

                           
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI深度学习算法实战代码解读

离下一篇原创,还差5个打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值