自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Transformer第二篇:Encoder

Encoder作为Transformer的核心组件,负责接收输入序列,并通过。,了解其核心结构和工作机制,探讨如何在模型中高效地处理和编码输入信息。接下来,我们将进入 Transformer 的 Encoder 结构。上一章我们得到了一个批次下的张量,其形状为。的相关原理,并探讨了如何将句子转换为。在上一章,我们详细介绍了。在本章,我们将深入解析。

2025-02-27 19:49:43 439

原创 Transformer第一篇:Embedding

在 Transformer 训练时,我们根据训练集出现的词构建一个词汇表(Vocabulary),为每个 Token 分配一个唯一的整数索引(token id)。在人工智能的世界里,有一种技术已经改变一切——从机器翻译到智能对话,从图像生成到代码编写,它的身影无处不在。这个张量不仅包含了 单词的语义信息,还融入了 位置信息,为后续的 Transformer 计算做好了充分准备。sin 和 cos 是周期函数,能够自然适应更长的序列,即使序列比训练时的长度大,也能继续泛化。假设句子长度为5,词向量维度为4。

2025-02-27 19:29:53 1653 2

原创 常用的Linux指令

常用的linux的指令

2025-02-05 12:19:04 177

原创 第三篇:学习InternVL2.0(探讨代码之训练模块版)

InternVL2的训练模块

2024-12-23 11:51:55 891

原创 第二篇:学习InternVL2.0(探讨代码之数据预处理版)

InternVL数据预处理

2024-12-23 11:47:49 1098

原创 第一篇:学习InternVL2.0(跑通代码版)

InternVL2.0的代码跑通

2024-12-15 12:34:22 1078 2

原创 利用ms-swift微调LLaVA-OneVision

利用ms-swift框架微调LLaVA-OneVision

2024-12-08 17:16:04 1486

原创 CCFCSP认证历年第二题(Python版汇总)

CCFCSP认证历年第二题(Python版汇总)

2023-07-16 17:14:17 2107 1

原创 CCFCSP认证历年第一题(Python版汇总)

CCFCSP认证python版第一题汇总大全

2023-07-09 13:46:42 3320 1

原创 在数据集有限的情况下,如何批量扩充训练集或数据集?(基于python利用旋转、镜像、添加高斯噪声的方法)

利用旋转、镜像、高斯噪声扩充数据集。

2023-04-18 22:45:25 2011 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除