大模型训练相关技术

最新推荐文章于 2024-06-15 11:56:23 发布

15122306087

最新推荐文章于 2024-06-15 11:56:23 发布

阅读量254

点赞数 4

文章标签：人工智能大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40467931/article/details/138626125

版权

多轮对话数据组织格式

直接构造包括多轮对话中所有机器人回复内容的标签，【充分地利用了所有机器人的回复信息】，同时【也不存在拆重复计算，非常高效】。

inputs = <user1> <assistant1> <user2> <assistant2> <user3> <assistant3>
labels = <-100> <assistant1> <-100> <assistant2> <-100> <assistant3>

为什么可以直接这样去构造多轮对话的样本呢？难道inputs中包括第二轮和第三轮的对话内容不会干扰第一轮对话的学习吗？

答案是不会。原因是LLM作为语言模型，它的注意力机制是一个单向注意力机制(通过引入 Masked Attention实现)，模型在第一轮对话的输出跟输入中存不存在第二轮和第三轮对话完全没有关系。

确实这么设计是最好的!

关注

4
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
大模型训练相关技术

多轮对话数据组织格式直接构造包括多轮对话中所有机器人回复内容的标签，【充分地利用了所有机器人的回复信息】，同时【也不存在拆重复计算，非常高效】。inputs = <user1> <assistant1> <user2> <assistant2> <user3> <assistant3>labels = <-100...
复制链接

扫一扫

15122306087 CSDN认证博客专家 CSDN认证企业博客

码龄7年

467: 原创

1万+: 周排名

8349: 总排名

11万+: 访问

: 等级

5135: 积分

506: 粉丝

474: 获赞

7: 评论

621: 收藏

私信

关注

热门文章

分类专栏

机器学习算法付费 41篇
发发发

最新评论

vscode 配置go环境
CSDN-Ada助手: 不知道 Go 技能树是否可以帮到你：https://edu.csdn.net/skill/go?utm_source=AI_act_go
英语词根研究和单词记忆
15122306087: https://www.cnblogs.com/zhangbo2008/p/17859015.html 这里是全的
codeformer 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Seeing What You Said: Talking Face Generation Guided by a Lip Reading Expert 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
传奇单机版批量修改爆率. 把所有物品爆率都改成1/10, 需要的话可以自己改更高....
15122306087: env/mosteritem

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

15122306087 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。