Wang CS-CSDN博客

原创大模型原理解释

在微调大语言模型时，模型的输入输出流程是核心部分。以下是具体的输入输出流程，包括数据如何进入模型、模型如何处理数据以及如何生成输出。以下是对大语言模型网络结构的详细解释，并举例说明每一层的输入和输出。，模型为 GPT-2，嵌入维度为 768，词汇表大小为 50257。大语言模型（如 GPT、BERT 等）的核心网络结构是基于。通过这种结构，大语言模型能够捕捉上下文信息并生成连贯的文本。Transformer 由多个组件组成，包括。

2025-01-06 16:07:25 976

原创 YOLO V1 V2算法总结

YOLO v1通过将目标检测问题转化为回归问题，实现了实时的目标检测速度。它通过一个单一的卷积神经网络一次性预测多个边界框和类别概率，大大简化了检测过程，适用于需要高效实时检测的场景。尽管YOLO v1在定位精度上稍逊色于一些多阶段检测器，但它的速度和简洁性使其成为许多实际应用中的首选。YOLO v2 通过网络结构优化、批量归一化、锚点机制、直接位置预测和多尺度训练等方法，在保持实时检测速度的同时显著提升了检测精度和鲁棒性。上述改进使得 YOLO v2 在实际应用中更加高效和实用。

2024-07-30 16:32:30 738

原创使用 softmax 函数进行归一化原因

σziezi∑j1nezjσzi∑j1nezjezi其中 ( z ) 是输入向量，( z_i ) 是向量中的第 ( i ) 个元素，( n ) 是向量的长度。Softmax 函数的梯度特性使其在神经网络训练中表现出色。它提供了平滑且数值稳定的梯度，使得优化过程更加高效和可靠。这些特性结合起来，使 softmax 成为分类问题中非常受欢迎的选择。

2024-07-18 17:24:32 1655

原创线性相位IIR滤波器

【代码】线性相位IIR滤波器。

2024-07-16 16:49:16 195

原创主成分分析

主成分分析（Principal Component Analysis，简称PCA）是一种常用的数据降维技术。它主要用于将高维数据映射到低维空间，同时尽可能保留原始数据中的重要信息。PCA 的基本思想是通过正交变换，把由线性相关的变量表示的观测数据转换为少数几个由线性无关变量表示的数据。线性变换将数据投影到新的坐标系中，这个新的坐标系的轴（即主成分）是原始数据中方差最大的方向。下面我会详细解释 PCA 的核心概念和步骤。

2024-07-07 12:01:20 652

原创 SVM的代码实现

max⁡α∑i1nαi−12∑i1n∑j1nαiαjyiyjKxixjαmaxi1∑nαi−21i1∑nj1∑nαiαjyiyjKxixjtrain_svm函数实现了一个简化的支持向量机训练过程。初始化alpha为零。在最大迭代次数内，遍历所有样本，计算梯度并更新alpha。每次更新alpha。

2024-07-04 23:13:55 1217

原创深入理解SVM核函数的概念

SVM试图在数据的不同类别之间找到一个最优的分离超平面，使得两类之间的间隔最大化。对于线性可分的数据，这个超平面就是线性的。Kxixjϕxi⋅ϕxjKxixjϕxi⋅ϕxj线性核Kxixjxi⋅xjKxixjxi⋅xj多项式核Kxixjxi⋅xjcdKxixjxi⋅xjcd高斯径向基函数（RBF）核Kxixjexp。

2024-07-04 22:55:16 1007

原创 IIR滤波器的结构比较（Direct I and Direct II Form）

存储需求直接 I 型结构需要更多的存储，因为它需要存储输入和输出的延迟项。直接 II 型结构需要较少的存储，因为它只需要存储中间变量的延迟项。数值稳定性直接 II 型结构通常比直接 I 型结构具有更好的数值稳定性，特别是对于高阶滤波器。这是因为直接 II 型结构在计算过程中减少了中间变量的累积误差。实现复杂度直接 I 型结构实现较为简单，直接根据传递函数进行计算。直接 II 型结构实现稍微复杂，需要将滤波器分解为两个部分来计算。

2024-06-10 15:51:15 2940 1

原创频谱搬移

信号与一个频率固定的余弦信号相乘在频域上相当于对信号的频谱进行移动处理，这是频谱分析中一个经典的结果。这个现象可以通过傅里叶变换和调制定理来解释。

2024-06-07 11:30:43 1156

原创关于FIR滤波器的一些细节问题

yn∑k0N−1hkxn−kynk0∑N−1hkxn−k其中，( h[k] ) 是滤波器的系数，( x[n] ) 是输入信号，( y[n] ) 是输出信号。通带增益是指在滤波器的通带内（通常是低频部分）输入信号的增益。对于理想的低通滤波器，通带增益应尽量接近1，表示信号在通带内没有被放大或衰减。综上所述，低通FIR滤波器的通带增益等于其滤波系数之和，因为在零频率（即直流成分）下，频率响应等于系数的和，而通带增益应尽量接近零频率的增益。

2024-06-07 11:22:53 2185

原创【关于傅里叶变换的一系列问题】

介绍了一些关于傅里叶变换的细节知识

2024-06-06 16:03:03 1349

原创滤波器群延时的概念

群延迟是相位响应的负导数。对于线性相位滤波器，相位响应是频率的线性函数，因此其导数是常数，表明群延迟是恒定的。

2024-05-31 12:24:34 5138

原创 TF-IDF解释

假设我们有以下三段简短的文本数据:文本1: 这个苹果很新鲜很甜文本2: 我买了一个苹果非常喜欢文本3: 这个苹果皮非常光滑首先,我们构建这个小文本集合的词典(vocabulary),去掉一些常见的无意义词语(如"的"、"一个"等),词典为:{‘这个’, ‘苹果’, ‘新鲜’, ‘甜’, ‘我’, ‘买了’, ‘非常’, ‘喜欢’, ‘皮’, ‘光滑’}共10个词条。接下来,计算每个词条在每个文本中的TF(词频)值,以及在整个文本集合中的IDF(逆向文档频率)值。

2024-05-08 22:39:56 684

原创稀疏数据在机器学习任务中的应用问题

在机器学习任务中，稀疏数据是指在大量数据中，只有少部分数据是有效或非零的情况。在稀疏数据集中，有大量的0值或者缺失值。例如，在自然语言处理中，当我们使用"词袋"模型表示文本信息时，我们通常会创建一个巨大的字典，其中每个单词都对应一个特定的维度。每个文档都可以表示为一个向量，向量中的元素数量与字典中的单词数量相同。然而，在某个具体的文档中，只有少数单词会出现，所以对应的向量中大多数元素都会是0，这样的向量就是稀疏的。假设我们有3篇文本，并用词袋（Bag-of-words）模型进行表示。

2024-05-08 22:30:02 862

原创麦克风性能参数

声压级的计算公式为：Lp=20log(p/p0)，其中Lp是声压级，p是测量的声压，p0是参考声压。抗风压能力：对着麦克风吹气可能会造成一定的风压，为防止这种风压影响麦克风的正常工作，麦克风应该有良好的抗风压能力。耐受最高声压级性能：如果人力的吹气可能会产生很大的声压，因此麦克风应当能耐受并准确的响应产生的声压级。灵敏度：麦克风需要有足够的灵敏度来捕捉到人对着麦克风吹气的声音，这涉及到麦克风对声压级的反应能力。动态范围：吹气声音的强弱可能会变化，因此麦克风应有足够宽的动态范围，以适应声音强度的变化。

2024-04-17 16:59:28 1266

原创机器学习工作流

本文的目的是演示如何构建一个相对完整的机器学习工作流。

2024-04-07 21:59:46 367

原创深度学习调参指南

tuning_playbook_zh_cn/深度学习调参指南中文版.pdf at main · schrodingercatss/tuning_playbook_zh_cn · GitHub

2024-03-26 11:37:16 633 1

原创在jupyter notebook中实现动态绘制学习曲线

【代码】在jupyter notebook中实现动态绘制学习曲线。

2024-03-14 17:41:23 309

原创医工融合期刊及论文汇总

1.Practical intelligent diagnostic algorithm for wearable 12-lead ECG via self-supervised learning on large-scale dataset2.Soli‑enabled noncontact heart rate detection for sleep and meditation tracking3.Algoritmically improved microwave radar monitors brea

2023-12-24 15:35:02 608

原创 Jupyter Notebook修改默认工作目录

2.在上述博客内容的基础上，这里不是删除【%USERPROFILE%】而是把这个地方替换为所要设置的工作目录路径，3.【起始位置】也可以更改为所要设置的工作目录路径（不一定需要这一步）

2023-12-21 15:41:49 1068

原创神经网络训练技巧

1. 逐渐增加训练数据规模，比如先在小数据集上训练，之后再增大数据集继续训练。

2023-11-23 16:55:09 130

原创 MATLAB读取每行文本并提取字符串后的数字

【代码】MATLAB读取每行文本并提取字符串后的数字。

2023-11-20 21:49:49 2104 2

原创信号相干解调

举一个例子，假设原始信号为m(t)，载波信号为c(t) = cos(2 * pi * fc * t)，其中fc为载波频率。调制信号进行低通滤波后可以获得原始信号，这是因为在相干解调过程中，接收信号与本地参考信号进行混频后的信号包含原始信号、高频载波信号以及可能的高频噪声。我们可以看到，混频信号包含了原始信号m(t)与高频成分（与4 * fc的频率项）的乘积。这就实现了将调制信号还原为原始信号。相干解调技术是一种有效的信号处理方法，它需要将接收信号与本地参考信号相乘，然后通过低通滤波器以获取原始调制信号。

2023-11-09 11:12:04 889 1

小王的博客

原创大模型原理解释

原创 YOLO V1 V2算法总结

原创使用 softmax 函数进行归一化原因

原创线性相位IIR滤波器

原创主成分分析

原创 SVM的代码实现

原创深入理解SVM核函数的概念

原创 IIR滤波器的结构比较（Direct I and Direct II Form）

原创频谱搬移

原创关于FIR滤波器的一些细节问题

原创【关于傅里叶变换的一系列问题】

原创滤波器群延时的概念

原创 TF-IDF解释

原创稀疏数据在机器学习任务中的应用问题

原创麦克风性能参数

原创机器学习工作流

原创深度学习调参指南

原创在jupyter notebook中实现动态绘制学习曲线

原创医工融合期刊及论文汇总

原创 Jupyter Notebook修改默认工作目录

原创神经网络训练技巧

原创 MATLAB读取每行文本并提取字符串后的数字

原创信号相干解调

转载岭回归（2范数），套索回归，弹性网络

原创拉格朗日对偶性

原创梯度

原创拉格朗日乘子法和KKT 条件解析

转载 Hyperopt 超参数调优

原创 Softmax

原创概率与统计

原创决策树

原创常用的核函数

原创支持向量机

原创卡方分布Chi-squared Distribution

原创统计学习方法之基本概念

维特智能标准上位机(V6.2.60).zip

空空如也