大模型
文章平均质量分 67
JerryFoo
这个作者很懒,什么都没留下…
展开
-
大模型之Chat Markup Language
CML 可以描述对话中的各种元素,例如对话的开始和结束、用户和 AI 助手的发言、对话中的问题和回答等等。因为我们的模型是基于用户的话语进行训练的,只被训练去预测 AI 助手说话的部分(在模型推理时,只需要根据用户的话回答用户)。在笔者应用大模型的场景中,对话模型(即大模型-chat系列)通常具有比较重要的地位,我们通常基于与大模型进行对话来获取我们希望理解的知识。一种简单对话数据的构建格式是,单纯的把系统信息和角色信息插入到每一个训练样本中,然后在对话用"序列结尾"的token(如)分隔开。原创 2023-10-22 12:56:25 · 1200 阅读 · 0 评论 -
LLAMA模型部署与一些关键定义
这个有很长的路要走,当前先不讲了,后面开一个专题讲讲。原创 2023-07-20 21:27:02 · 424 阅读 · 0 评论