信我,有你想要的!最大化deepseek潜能 - 动态注意力机制(第5讲)

《‍deepseek原理应用与实践》

5.deepseek极限潜能 - 动态注意力机制

deepseek原理+应用+实践,和大家分享:

1. 小众的,deepseek核心技术原理

2. 大众的,提示词要怎么写

今天和大家聊聊,deepseek的核心技术之一的动态注意力机制

要搞懂这个,先得知道什么是注意力机制?

d0230f18633fe09b9ec3054afdba0a18.png

这是一种通过计算…查询向量(Query)…键向量(Key)…值向量(Value)…,最终得到...的技术。

画外音:额,不折磨大家了。

注意力机制,Attention Mechanism,是如今AI最核心的技术(之一)。通俗地说,它允许模型在处理信息时,专注于最关键的部分,弱化甚至忽略不相关的信息,从而提高处理效率与回复的质量。它通过注意力分数,来量化描述某一部分信息被关注的程度,以反映相关信息在全局中的重要性。

举个例子,用户输入提示词:

哎哟妈呀,我跟你说,那啥,我今天早上出门,这天儿可够冷的,那风嗖嗖的,吹得我脸都僵了,我寻思着,咋这么冷呢,是不是把厚棉袄穿少了,你说这天儿咋就那么邪乎呢,反正我这心里寻思着,哪儿能去买个暖宝宝贴贴。

这个提示词中包含大量日常交流习惯中的铺垫与情感表达,属于无效信息。注意力机制会让模型将注意力专注在:今天早上很冷,我穿少了,哪

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值