[论文笔记] Do Llamas Work in English?On the Latent Language of Multilingual Transformers

心心喵

已于 2024-08-20 11:48:13 修改

阅读量218

点赞数

分类专栏：论文笔记文章标签：论文阅读

于 2024-08-20 11:47:58 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Trance95/article/details/140712936

版权

论文笔记专栏收录该内容

158 篇文章 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

我们提出一个问题，即在不平衡的、以英语为主的语料库上训练的多语言模型是否使用英语作为内部枢纽语言。这对于理解语言模型的功能和语言偏见的起源来说是至关重要的问题。我们研究的重点是Llama-2系列的Transformer模型。本研究使用精心构建的非英语提示词，具有唯一正确的单词续词。Transformer从一层到另一层，逐步将最终提示词的输入嵌入映射到输出嵌入，从中计算下一个词的概率。通过追踪中间嵌入在其高维空间中的变化，揭示了三种不同的阶段：

（1）中间嵌入最初远离输出词嵌入；

（2）在中间层中，尽管中间嵌入已经可以解码语义上正确的下一个词，但其英语版本的概率高于输入语言的版本；

（3）最终进入嵌入空间中输入语言特定的区域。

我们将这些结果归纳为一个概念模型，其中这三个阶段分别在“输入空间”、“概念空间”和“输出空间”中运行。关键是，我们的证据表明ÿ

了解本专栏

超级会员免费看

博客等级

码龄8年

765
原创

746
点赞

1155
收藏

6318
粉丝

关注

私信

热门文章

分类专栏

论文笔记付费 158篇
机器学习付费 33篇
算法导论付费 170篇
nlp 付费 116篇
redis
paddle
预训练语言模型 2篇
机器视觉
OT 3篇
强化学习 1篇
java 7篇
linux 151篇
RS 8篇
c 5篇
c++ 13篇
python 28篇
tensorflow2.0 7篇
深度学习 14篇
笔记
pytorch 7篇
LRFR 1篇
论文 2篇
cv 13篇

最新评论

[论文笔记] Deepseek技术报告解读: MLA&MTP
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑
心心喵: 就是有缓存过tokenizer 的cache的情况下，优先读取path中已经缓存的结果
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑
chuangzhidian: 没看到
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑
chuangzhidian: tokenized_path在哪里注释呢？
[论文笔记] GRPO & DPO
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

心心喵 喵喵(*^▽^*）

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。