python
文章平均质量分 66
行走的小骆驼
这个作者很懒,什么都没留下…
展开
-
大模型面试题2
Transformer为何使用多头注意力机制?(为什么 不使用一个头)Transformer为什么Q和K使用不同的权重矩阵生 成,为何不能使用同一个值进行自身的点乘?Transformer计算attention的时候为何选择点乘而 不是加法?两者计算复杂度和效果上有什么区 别?为什么在进行softmax之前需要对attention进行 scaled(为什么除以dk的平方根),并使用公式 推导进行讲解在计算attention score的时候如何对padding做 mask操作?为什么在进行多头注意力的时候需原创 2024-09-01 15:52:44 · 377 阅读 · 0 评论 -
类属性和对象中的属性混淆概念,计算的时候容易模糊不清
很多同学在定义类和对象的时候会混淆类属性和对象属性,这里我将带大家一起详细的了解一下,进行计算的时候会蒙原创 2023-12-01 18:05:25 · 423 阅读 · 1 评论 -
容器类型(字符串、列表、元组、字典、集合)之常用函数
容器类型(字符串、列表、元组、字典、集合)之常用函数及公共函数和运算符,包含详细代码讲解,全网最详细学习宝地。看这一篇文章就够了原创 2023-12-04 11:50:17 · 915 阅读 · 1 评论 -
python绘图遇到汉字及负号乱码怎么办
各位学习的小伙伴可以直接复制上述的代码到自己代码的最上方,全部解决,拿下!原创 2024-02-07 00:15:27 · 233 阅读 · 1 评论