SimpleLearing-CSDN博客

原创基于BERT模型的文本分类示例

定义一个继承自Dataset的类，用于封装文本数据和标签。# ...（省略类定义的代码以节省空间）使用AdamW作为优化器，并定义交叉熵损失函数。num_training_steps = len(dataloader) * 3 # 假设我们训练3个epoch。

2024-05-21 21:19:06 184

原创双向长短期记忆网络（BiLSTM）简介

双向长短期记忆网络（Bidirectional Long Short-Term Memory, BiLSTM）是一种改进的循环神经网络（Recurrent Neural Network, RNN），专门设计用于处理序列数据。BiLSTM 能够通过结合前向和后向两个 LSTM 网络的输出来捕捉序列中的双向依赖关系。

2024-05-17 16:16:55 544

原创 maxpooling2d的C++细节实现

/ 最大池化函数// 实现代码// 计算输出张量的大小// 初始化输出张量float// 对输入张量进行最大池化++i) {++j) {// 计算当前池化窗口的位置// 找到池化窗口内的最大值h < end_h;++w) {

2024-05-09 20:45:56 215

原创 LoRA（Low-Rank Adaptation）原理与应用

LoRA是一种用于调整和微调大型神经网络的技术，特别适用于直接微调整个网络参数成本高昂或不切实际的情况。

2024-04-23 22:08:53 522

原创 `extern` 关键字的用法cpp

extern关键字在 C 和 C++ 中用于声明变量或函数是在其他地方定义的，它有助于跨源文件共享数据和函数，以及在 C++ 中与 C 语言代码进行互操作。

2024-04-16 17:39:01 406

原创统计Excel文件中的答案选项和类别

通过这个脚本，我们可以快速地从Excel文件中提取和统计答案选项及职务类别的分布情况，并将结果以JSON格式保存，便于进一步的分析和处理。上述代码和文档中的文件路径和问题列表是示例性的，需要根据实际情况进行调整。在运行脚本之前，请确保您的环境中已安装了。脚本将自动执行统计操作，并将结果保存到指定的JSON文件中。水平有限，有问题随时交流；

2024-04-07 18:37:52 480

原创 Python 中的 `deque` 用法介绍

deque（双端队列）是 Python模块中的一个数据结构，它允许你在队列的两端进行添加（append）和弹出（pop）操作。deque是一个线程安全的双向链表，适用于需要快速添加和删除元素的场景。以下是deque的一些基本用法和特性。

2024-04-02 15:38:39 432

原创 C++ STL中Queue和Stack的用法

队列（Queue）是一种先进先出（FIFO）的数据结构，在C++的STL中由queue模板类实现。// 创建一个整数类型的队列栈（Stack）是一种后进先出（LIFO）的数据结构，在C++的STL中由stack模板类实现。// 创建一个整数类型的栈。

2024-04-02 14:16:55 400

原创 C++ STL中Vector的常用函数和用法

/ 直接初始化一个包含5个整数的Vector。

2024-04-02 12:24:50 322

当我们使用BERT或其他类似的预训练语言模型时，将句子转换为token的过程通常涉及以下几个步骤：初始化Tokenizer：首先，我们需要导入相应的Tokenizer类，并根据需求选择合适的预训练模型进行初始化。分词（Tokenization）：分词是将句子分割成单词或者子词（subword）的过程。这个过程通常包括将句子转换为小写（如果使用的模型支持小写输入）、识别并标记单词边界、将单词分割为子词（如果使用的是基于WordPiece或Byte-Pair Encoding的模型），等等。

2024-03-26 19:10:40 413

原创 Embedding层的简述及其代码实现

Embedding层是深度学习中常用的一种层类型，主要用于将离散的符号（如单词、字符等）映射到连续的低维稠密向量空间中。它在自然语言处理（NLP）任务中得到广泛应用，用于将词汇表中的单词映射为向量表示，从而方便神经网络模型理解和处理文本数据。

2024-03-26 17:30:37 431

原创 C++ 中的 unordered_map 用法文档

是 PyTorch 中用于生成标量张量的函数之一。它会创建一个包含一个元素且值为1的标量张量，通常用于表示单个数值，比如损失函数的值或者模型的参数初始化值。

2024-03-25 20:06:51 247

原创细节之PyTorch 中的 torch.ones([])

是 PyTorch 中用于生成标量张量的函数之一。它会创建一个包含一个元素且值为1的标量张量，通常用于表示单个数值，比如损失函数的值或者模型的参数初始化值。

2024-03-25 16:01:31 495

原创注意力机制与交叉注意力：理论、公式与实现

在自然语言处理（NLP）和深度学习领域，注意力机制和交叉注意力是两种强大的技术，它们允许模型在处理序列数据时动态地聚焦于最重要的部分。本文将介绍这两种机制的数学原理，并通过代码示例展示如何在PyTorch中实现它们。

2024-03-22 11:53:31 1534

原创解决 Jupyter Notebook 中没有显示想要的内核的问题

如果在 Jupyter Notebook 的 “Kernel” 菜单中没有显示你想要的内核（kernel），可能是因为该内核没有正确安装或配置到 Jupyter Notebook 中。：如果内核仍然没有出现在 “Kernel” 菜单中，你可以尝试手动将内核添加到 Jupyter Notebook 中。是你想要添加的内核的名称，安装完成后，重新启动 Jupyter Notebook，然后尝试切换到你添加的新内核。安装完成后，重新启动 Jupyter Notebook，然后尝试切换内核。

2024-03-21 16:21:56 907

原创 FLOPS 与 FLOPs 的区别解析

概念不同：FLOPS 表示每秒浮点运算次数，是计算设备的计算性能指标；而 FLOPs 表示模型中的浮点运算操作总数，是模型计算复杂度的指标。应用不同：FLOPS 用于评估计算设备的处理能力和性能；FLOPs 用于衡量模型的计算复杂度和计算量。单位不同：FLOPS 的单位是每秒浮点运算次数（如 TFLOPS、GFLOPS）；FLOPs 的单位是浮点运算操作总数（如 MFLOPs、GFLOPs）。水平有限，有问题随时联系；

2024-03-21 15:32:47 769

原创 Domain Adaptation模型之pix2pix原理简介

pix2pix和CycleGAN是两种基于深度学习的图像到图像翻译模型，它们在图像风格转换、图像修复、图像增强等多个方面都有广泛的应用。通过理解它们的原理和网络结构，我们可以更好地应用这些模型来解决实际问题，并推动计算机视觉领域的发展。

2024-03-18 20:00:07 574

原创多模态模型之CLIP模型简介

CLIP 模型通过对比学习实现了图像和文本之间的跨模态理解，为多种任务提供了强大的支持。

2024-02-27 21:53:43 911

原创快速排序、归并排序和堆排序的原理与实现

归并、快速，堆排序

2024-02-23 19:39:44 427

原创如何在python中找到函数所在文件的位置

Python中如果我们想知道api函数所在文件的位置，可以如下操作。

2024-02-23 11:12:05 272

原创直方图均衡化原理与代码实现

直方图均衡化是一种有效的图像增强技术，通过调整图像的灰度级别分布，改善图像的对比度和细节。在实际应用中，根据具体任务需要，可以选择是否使用直方图均衡化以及调整参数以达到最佳效果。

2024-01-31 21:58:11 430

原创直方图变换简介与实现

直方图变换是一种常用的图像处理技术，用于调整图像的亮度和对比度。通过选择合适的变换方法，我们可以优化图像以满足不同的需求。在实际应用中，需要根据具体任务调整参数和选择适当的变换方法。

2024-01-31 21:49:05 379

原创图像的拉普拉斯变换实现

--

2024-01-31 21:22:03 945

原创卷积层和反卷积层输出特征图大小计算

需要注意的是，反卷积的填充指的是输出特征图的填充，而不是输入特征图的填充。在反卷积中，输出特征图的填充会增加输出特征图的大小。总的来说，计算输出特征图大小的公式考虑了输入特征图的尺寸、卷积核的大小、填充的大小、步长和输出填充的大小等参数。当我们有一个输入特征图大小为 26x26 ，反卷积核大小为 3x3 ，步长为 1 ，输出填充为 0 的情况下，计算反卷积层的输出特征图大小。当我们有一个输入特征图大小为 28x28 ，卷积核大小为 3x3 ，步长为 1 ，填充为 0 的情况下，计算卷积层的输出特征图大小。

2024-01-30 10:41:48 1203

空空如也

空空如也