自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_69051120的博客

原创 Transformer第二篇：Encoder

Encoder作为Transformer的核心组件，负责接收输入序列，并通过。，了解其核心结构和工作机制，探讨如何在模型中高效地处理和编码输入信息。接下来，我们将进入 Transformer 的 Encoder 结构。上一章我们得到了一个批次下的张量，其形状为。的相关原理，并探讨了如何将句子转换为。在上一章，我们详细介绍了。在本章，我们将深入解析。

2025-02-27 19:49:43 439

原创 Transformer第一篇：Embedding

在 Transformer 训练时，我们根据训练集出现的词构建一个词汇表（Vocabulary），为每个 Token 分配一个唯一的整数索引（token id）。在人工智能的世界里，有一种技术已经改变一切——从机器翻译到智能对话，从图像生成到代码编写，它的身影无处不在。这个张量不仅包含了单词的语义信息，还融入了位置信息，为后续的 Transformer 计算做好了充分准备。sin 和 cos 是周期函数，能够自然适应更长的序列，即使序列比训练时的长度大，也能继续泛化。假设句子长度为5，词向量维度为4。

2025-02-27 19:29:53 1653 2

原创常用的Linux指令

常用的linux的指令

2025-02-05 12:19:04 177

原创第三篇：学习InternVL2.0（探讨代码之训练模块版）

InternVL2的训练模块

2024-12-23 11:51:55 891

原创第二篇：学习InternVL2.0（探讨代码之数据预处理版）

InternVL数据预处理

2024-12-23 11:47:49 1098

原创第一篇：学习InternVL2.0（跑通代码版）

InternVL2.0的代码跑通

2024-12-15 12:34:22 1078 2

原创利用ms-swift微调LLaVA-OneVision

利用ms-swift框架微调LLaVA-OneVision

2024-12-08 17:16:04 1486

原创 CCFCSP认证历年第二题（Python版汇总）

CCFCSP认证历年第二题（Python版汇总）

2023-07-16 17:14:17 2107 1

原创 CCFCSP认证历年第一题（Python版汇总）

CCFCSP认证python版第一题汇总大全

2023-07-09 13:46:42 3320 1

原创在数据集有限的情况下，如何批量扩充训练集或数据集？（基于python利用旋转、镜像、添加高斯噪声的方法）

利用旋转、镜像、高斯噪声扩充数据集。

2023-04-18 22:45:25 2011 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除