《deepseek原理应用与实践》
5.deepseek极限潜能 - 动态注意力机制
deepseek原理+应用+实践,和大家分享:
1. 小众的,deepseek核心技术原理;
2. 大众的,提示词要怎么写;
今天和大家聊聊,deepseek的核心技术之一的动态注意力机制。
要搞懂这个,先得知道什么是注意力机制?

这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…,最终得到...的技术。
画外音:额,不折磨大家了。
注意力机制,Attention Mechanism,是如今AI最核心的技术(之一)。通俗地说,它允许模型在处理信息时,专注于最关键的部分,弱化甚至忽略不相关的信息,从而提高处理效率与回复的质量。它通过注意力分数,来量化描述某一部分信息被关注的程度,以反映相关信息在全局中的重要性。
举个例子,用户输入提示词:
哎哟妈呀,我跟你说,那啥,我今天早上出门,这天儿可够冷的,那风嗖嗖的,吹得我脸都僵了,我寻思着,咋这么冷呢,是不是把厚棉袄穿少了,你说这天儿咋就那么邪乎呢,反正我这心里寻思着,哪儿能去买个暖宝宝贴贴。
这个提示词中包含大量日常交流习惯中的铺垫与情感表达,属于无效信息。注意力机制会让模型将注意力专注在:今天早上很冷,我穿少了,哪

最低0.47元/天 解锁文章
294

被折叠的 条评论
为什么被折叠?



