百聆:实现交互式多语言翻译任务对齐,跨语言迁移模型能力登峰突破!

【导读】中科院计算所NLP团队发布的百聆模型,通过利用翻译任务中的语义对齐特性,实现了模型在不同语言之间的生成能力迁移。在交互式学习过程中,该模型能够灵活学习并与人类意图对齐,为实现模型能力在不同语言之间的跨越式迁移提供了创新途径。

中国科学院计算技术研究所自然语言处理团队已在始智AI wisemodel.cn开源社区发布了百聆(BayLing)系列大模型。该系列包括BayLing-7B-V1.0和BayLing-7B-V1.0/V1.1两个版本,分别以LLaMA-7B和LLaMA-13B为基座模型,并通过对16万条多轮交互式翻译数据的微调而得以构建。实验结果显示,在各种多语言和通用任务中,百聆均表现出卓越的性能。然而,在需要逻辑推理的数学、编码和推理等任务方面,与GPT-3.5-turbo相比,仍存在一定的差距。

wisemodel页面:

百聆官网:

mlops.ccloud.conestore.cn:30010/bayling/#/icon-default.png?t=N7T8http://mlops.ccloud.conestore.cn:30010/bayling/#/

本文介绍了一种名为BayLing的交互式翻译模型,该模型通过将英语语言生成和指令遵循能力转移到其他语言中,以提高非英语语言的性能。作者使用了LLaMA作为基础模型,并自动构建了用于指导调整的交互式翻译指令。实验结果表明,尽管参数量只有13亿,但BayLing在多轮指令测试集上实现了与GPT-3.5-turbo相当的表现。此外,BayLing还展示了出色的中国高考和美国SAT知识评估表现,仅次于GPT-3.5-turbo。

百聆模型概述

现有的大语言模型主要专注于英语(或中文),在非英语语言上的表现相对较差。构建庞大的非英语语料库用于基座模型的训练以增强该语言的生成能力,并建立该语言的指令集用于指令微调,是一项昂贵而繁重的任务。为应对这一挑战,百聆研究团队探索了在指令微调阶段将英语与其他语言对齐的方法,并提出了以交互式翻译为核心的指令微调训练方法。这一方法实现了大型模型在学习遵循指令的同时,将语言生成和指令遵循的能力从英语传递到其他语言。

百聆研究团队通过设计的交互翻译指令自动构建方法,为模型提供了包括中、英、德、法四门语言的涵盖性交互式翻译指令和约束条件。模型要求在理解所有先前指令的基础上,提供满足用户需求的生成内容。基于百聆-7B和百聆-13B的相关实验结果表明,在借助翻译任务的语义对齐特性的同时,模型能够实现生成能力在不同语言之间的迁移,并在交互式的过程中灵活学习与人类意图的对齐。

百聆模型表现

首先,在WMT22的中-英翻译和英-德翻译基准上对百聆的多语言能力进行了评估。对于中-英翻译,百聆的翻译质量仅次于GPT-4/GPT-3.5-turbo和谷歌翻译,明显优于其他系统,如NLLB-3.3B、ChatGLM-6B、ParroT-7B等。具体而言,百聆-13B在中文到英文和英文到中文的翻译能力上分别达到了GPT-4的94%和97%。对于英-德翻译,百聆超过了大多数系统,在德文到英文和英文到德文的翻译能力上分别达到了GPT-4的97%和95%。

为了评估百聆的多轮交互能力,研究团队创建了包含80条中英文多轮指令的百聆-80测试集,涵盖了广泛的通用任务,全面评估模型的性能。以GPT-4作为评估器,对百聆-13B和GPT-3.5-turbo的回答进行打分,评分范围为1到10。结果显示,百聆-13B在通用、知识、常识和写作任务上的表现与GPT-3.5-turbo相当。然而,在需要逻辑推理的数学、编码、推理等任务上,百聆-13B与GPT-3.5-turbo仍存在明显差距。

百聆模型DEMO

通过交互改善翻译结果,用户可以通过按钮进行反馈:

诗词翻译:

更多详情可以参与以下内容:

Github页面: https://github.com/ictnlp/BayLing

论文链接: https://arxiv.org/abs/2306.10968

项目首页: https://nlp.ict.ac.cn/bayling

  • 23
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
登峰CNC改坐标及连接程式软件是一款专为数控机床设计的软件,其主要功能是用于修改机床的坐标和连接程序。这款软件具有以下几个主要特点。 首先,该软件具备强大的修改坐标功能。用户可以通过该软件对数控机床的坐标进行精确的调整,包括坐标原点的设置、数控轴的位置修正等等。通过这些功能,用户可以对数控机床进行个性化的调整,以适应不同的加工需求。 其次,该软件还提供了连接程式的编写功能。用户可以使用该软件编写适用于特定加工任务的连接程式,通过这些程式可以实现数控机床的自动运行。用户可以在软件中设置各种加工参数,包括刀具路径、工件尺寸、加工速度等等。通过连接程式的编写,用户可以实现数控机床的高效、准确的自动加工。 此外,该软件还具有友好的用户界面和简单易用的操作方式。用户可以通过直观的界面进行各种操作,如修改坐标、编写连接程式等等。同时,软件还提供了详细的使用说明,方便用户快速上手。 总的来说,登峰CNC改坐标及连接程式软件是一款功能强大的数控机床辅助软件。它提供了丰富的功能和方便的操作,能够满足用户对数控机床进行精确调整和自动加工的需求。无论是专业的数控加工厂还是个人制造业者,都可以通过该软件提高工作效率,实现更高质量的加工。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

TZa1u

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值