Blossomers-CSDN博客

原创 conda虚拟环境中升级pip版本问题

conda虚拟环境下pip升级版本问题的解决

2023-01-02 17:48:51 968 3

原创 Arithmetic Code 算术编码

算术编码的原理简介以及python代码复现

2022-07-21 21:26:42 1956

原创 Huffman编码及其实现[Python]

Huffman编码原理简述+实现

2022-07-15 14:07:39 2113

闲的没事就折腾呗~之前做的那个暴力检测感觉光用ResNet3D去做有点简单，现在想着要去融合一下音频数据，对于音频数据做MFCC之后再辅助检测一手，看看效果咋样~一、MFCC的基本概念就是从低频到高频的一组滤波器，经过这组滤波器输出的信号能量，经过进一步数字化处理后，既可作为输入信号的基本特征。STFT：就是在波形图上滑窗做FFT，得到频谱随着时间变化的信息，也就是一种时频分析的方法。记录：一些比较常用的音频处理工具Python librosa工具包..

2022-05-27 19:41:19 1817 2

原创 3DResNet 学习记录

近期同时在进行的两个深度学习项目都需要用到3DResNet模型，本着不做调包侠的心态，还是要好好把模型的原理看一看的。1、ResNet结构理解首先先理解一下二维的ResNet吧。

2022-05-12 17:16:32 10445

原创 Self-attention模块学习记录（附代码复现）

尝试一下以问答的形式，阐述自己对自注意力模型的理解。1、self-attention模块，输入与输出在通道数上是相同的，如何理解？这是由模块的计算方式所决定的。首先需要弄清楚的是，模块的输入可以看作是一个句子里的各个词组，比如说I love eating apples. 那输入就包括这四个单词，以及句子的结束标志'.' 经过embedding得到的特征向量。输出的是这个词组与其他词组的关联程度，也就是Z向量。从直观上看，这两者都是围绕着“一个词”所做的编码工作，那么在通道数目上自然是会相等的

2022-05-02 17:16:32 3204

原创深度学习环境配置记录（pytorch+cudatoolkit）

配置cuda的一些记录，参考内容很有价值，有助于新手快速理解cuda及其他包的作用。

2022-04-15 13:35:25 2855

原创关于网络结构输出层加了softmax后，loss训练不下降的问题

小白第一次写，很多地方会显得比较生疏……首先记录的是为什么多分类问题中需要用softmax+crossentropyloss交叉熵函数的配合。交叉熵本质上是衡量输入与输出之间的区别，其值越小，则区别越小，毕竟从名字上看，熵就是衡量一种混乱程度嘛。在多分类问题中，我们通常会将输入的标签编码为one-hot形式，形如[0,0,1,0,0]，则此数据属于数据集中的第三类。这是交叉熵函数的输入之一。在我们训练的神经网络最后一层，我们通常会使用一个全连接层，其输出维度就是我们类的总个数。假定输..

2022-04-10 21:29:39 5421 5