大模型可拓展代码库汇总

机器翻译智能体

改变传统,吴恩达开源了一个机器翻译智能体项目

翻译智能体:使用反思工作流进行智能体翻译

这是一个使用 Python 演示的反思智能体工作流的机器翻译示例。主要步骤如下:

1. 输入 prompt,使大型语言模型(LLM)将文本从 source_language 翻译成 target_language;

2. 让 LLM 反思翻译结果,并提出建设性的改进建议;

3. 利用这些建议改进翻译。

例如:通过更改 prompt,这种工作流比传统的机器翻译(MT)系统更容易实现以下功能:

  • 修改输出的风格,如正式 / 非正式。
  • 指定如何处理习语和特殊术语,如名字、技术术语和缩写。例如,在 prompt 中包含术语表,可以确保特定术语(如开源、H100 或 GPU)翻译的一致性。
  • 指定特定区域的语言使用或特定方言,以服务目标受众。例如,拉丁美洲的西班牙语与西班牙的西班牙语不同;加拿大的法语与法国的法语不同。

xtuner

XTuner是一个由MMRazor和MMDeploy联合开发的大语言模型微调工具箱。它主要面向需要对LLM进行定制化调整的研究者和开发者,尤其是那些没有深厚技术背景但希望利用LLM进行特定任务的用户。XTuner的设计目标是使微调过程尽可能简单,即使是0基础的非专业人员也能一键开始微调。

重点看 dpo ,奖励模型,加速训练

快速上手 — XTuner 0.1.23 文档

RLHF:

https://zhuanlan.zhihu.com/p/622134699

https://mp.weixin.qq.com/s/f7rkS1bFo0ZtJ7pptYbBQQ

  • 5
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值