自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_42869271的博客

原创多维Tensor作为张量索引

注：row_idx和col_idx的维度务必相同，例如row_idx.size()=(256,1,1)，col_idx.size()=(256,58,64),不然无法映射。可以看出代码将原第3行的第2，3，4列，第二行的第1，3，2列以及第1行的第0，1，3列所对应的0修改为1，此时已经意思已经很明显了，即。可见mask通过上述索引，维度从(4,5)变为了(3,3,2)，即通过索引张量row_idx和col_idx张量对应维度映射，

2023-09-20 10:52:11 86 1

原创深度学习—self attention

这样便可以将self attention的作用看的比较清楚，只是如果这样的话，其结果就完全取决于embedding的结果，因此在这个基础上，可加上Wq，Wk，Wv（需要训练的三个矩阵），这样才能通过训练得到想要结果，而不是只依赖embedding。如果感觉有些难以理解的话，可先不用考虑Wq，Wk，Wv三个矩阵，即只是用a1分别于a1、a2、a3、a4作内积，并归一化后（归一化后得到a1、a2、a3、a4之间的相关度）再分别与a1、a2、a3、a4相乘再相加，得到b1。而向量间的夹角小于90°，则内积为正。

2023-07-28 20:15:20 79 1

原创强化学习-贝尔曼最优公式

定义：如 policy 在任意 state 对应的 state value 都大于等于其他 policy，该 policy 为最优 policy。

2023-07-27 22:34:22 63 1

原创强化学习-Bellman Equation

bootstrapping：从当前状态出发得到的return依赖于其他状态出发得到的return。但是怎么通过v2求解v1呢？可通过如下方式求解：通过上式简单计算便可得到v向量。考虑下面是一个多步骤的trajectory：那discounted return为：定义 state-value 为 Gt 的期望值，即多条 trajectory 的 return 的期望：其中 state value 是 state 的函数，代表着policy策略。

2023-07-27 16:05:48 69 1

原创强化学习-基本概念

trajectory：state-action-reward链，遇到终点后的trajectory也可以叫episode。reward：agent在设计时会朝着reward期望最多的方向前进，其主要依赖当前的state和action。discounted return：在return中各项reward前×对应次方的gamma。policy：告诉agent在对应state下执行哪种action。return：trajectory中所有的reward求和。action：基于state可采取的行动。

2023-07-26 14:17:42 43 1

原创深度学习小白篇——pytorch加载数据

Dataloader：为神经网络提供不同的数据形式。Dataset：提供一种获取数据及其标签的方式。

2023-05-18 14:19:09 40 1

原创 python——类的继承汇总

1、super(子类名，self).__init__(继承变量名1，继承变量名2)2、父类名.__init__(self，继承变量名1，继承变量名2)

2023-05-12 21:33:30 36 1

原创深度学习小白篇——显卡，显卡驱动，cuda的理解

CUDA：现目前的显卡计算能力已经远超CPU，不满足于其只是单纯的用作图像处理，但直接操作GPU又过于复杂，因此英伟达推出用于自家GPU的并行计算框架（可理解为驱动的延伸），在 CUDA 的架构下，一个程序分为两个部份：host 端和 device 端。Host 端是指在 CPU 上执行的部份，而 device 端则是在显示芯片上执行的部份。

2023-05-10 10:00:43 804

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

Pig璠 CSDN认证博客专家 CSDN认证企业博客

码龄6年

IP 属地：四川省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

8: 原创

179万+: 周排名

31万+: 总排名

1219: 访问

: 等级

81: 积分

0: 粉丝

1: 获赞

7: 评论

5: 收藏

私信

关注

热门文章

最新评论

多维Tensor作为张量索引
CSDN-Ada助手: 恭喜您写了第8篇博客！标题“多维Tensor作为张量索引”很吸引人。您对这个主题的深入探讨令人印象深刻。在这篇博客中，您清楚地阐述了多维Tensor在张量索引中的应用。接下来，我希望您能进一步探索如何在实际问题中使用这种索引方法，例如在图像处理或自然语言处理中。期待您的下一篇博客！
强化学习-基本概念
CSDN-Ada助手: 恭喜您写下了第四篇博客！标题“强化学习-基本概念”非常吸引人，从标题就能感受到您在探索强化学习领域的努力。持续创作博客是一个很好的方式来加深对知识的理解，并与他人分享您的见解。接下来，我建议您可以考虑在博客中进一步探讨强化学习的实际应用案例或者针对某个特定问题进行深入分析，这样可以帮助读者更好地理解概念，并将其应用到实践中。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
强化学习-Bellman Equation
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“强化学习-Bellman Equation”非常吸引人。您对强化学习以及Bellman方程的深入探讨令人印象深刻。作为一个读者，我对您的知识广度和深度感到钦佩。在下一步的创作中，我希望您能够进一步挖掘Bellman方程在实际问题中的应用，并分享一些案例或者实验结果。此外，您还可以考虑介绍一些与强化学习相关的最新研究成果或者应用领域，这将为读者提供更多的学习和思考的机会。再次恭喜您的持续创作，期待您未来更多精彩的博客！
强化学习-贝尔曼最优公式
CSDN-Ada助手: 恭喜您写了第6篇博客！标题“强化学习-贝尔曼最优公式”听上去很有深度。您对这个主题进行了深入的探讨，让读者们对贝尔曼最优公式有了更清晰的理解。您的持续创作令人钦佩，希望您能继续分享更多关于强化学习的知识。如果可以的话，下一步的创作建议是可以探讨一下贝尔曼最优公式在实际问题中的应用案例，这样读者们可以更好地将理论与实践相结合。期待您的下一篇博客！
深度学习—self attention
CSDN-Ada助手: 恭喜您写了第7篇博客！标题“深度学习—self attention”让我非常兴奋地点击进来阅读。深度学习的领域一直在不断发展，而self attention作为其中的一个重要概念，对于我们理解和应用深度学习具有重要意义。通过您的博客，我对self attention有了更深入的了解，感谢您的分享！在下一步的创作中，我想建议您探索一下self attention在不同领域的应用案例。例如，您可以尝试将self attention应用于自然语言处理或计算机视觉等领域，以展示其在实际问题中的效果和潜力。同时，您也可以结合其他相关概念，如Transformer模型等，进一步拓展您的内容，让读者们可以更全面地了解self attention在深度学习中的作用。再次恭喜您的连续创作，期待您未来更多精彩的博客！谢谢您的分享！

最新文章

提示

确定要删除当前文章？

取消删除