自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 conda虚拟环境中升级pip版本问题

conda虚拟环境下pip升级版本问题的解决

2023-01-02 17:48:51 968 3

原创 Arithmetic Code 算术编码

算术编码的原理简介 以及python代码复现

2022-07-21 21:26:42 1956

原创 Huffman编码及其实现[Python]

Huffman编码原理简述+实现

2022-07-15 14:07:39 2113

原创 MFCC学习记录

闲的没事就折腾呗~之前做的那个暴力检测感觉光用ResNet3D去做有点简单,现在想着要去融合一下音频数据,对于音频数据做MFCC之后再辅助检测一手,看看效果咋样~一、MFCC的基本概念就是从低频到高频的一组滤波器,经过这组滤波器输出的信号能量,经过进一步数字化处理后,既可作为输入信号的基本特征。STFT:就是在波形图上滑窗做FFT,得到频谱随着时间变化的信息,也就是一种时频分析的方法。记录:一些比较常用的音频处理工具Python librosa工具包..

2022-05-27 19:41:19 1817 2

原创 3DResNet 学习记录

近期同时在进行的两个深度学习项目都需要用到3DResNet模型,本着不做调包侠的心态,还是要好好把模型的原理看一看的。1、ResNet结构理解首先先理解一下二维的ResNet吧。

2022-05-12 17:16:32 10445

原创 Self-attention模块学习记录(附代码复现)

尝试一下以问答的形式,阐述自己对自注意力模型的理解。1、self-attention模块,输入与输出在通道数上是相同的,如何理解?这是由模块的计算方式所决定的。首先需要弄清楚的是,模块的输入可以看作是一个句子里的各个词组,比如说I love eating apples. 那输入就包括这四个单词,以及句子的结束标志'.' 经过embedding得到的特征向量。输出的是这个词组与其他词组的关联程度,也就是Z向量。从直观上看,这两者都是围绕着“一个词”所做的编码工作,那么在通道数目上自然是会相等的

2022-05-02 17:16:32 3204

原创 深度学习环境配置记录(pytorch+cudatoolkit)

配置cuda的一些记录,参考内容很有价值,有助于新手快速理解cuda及其他包的作用。

2022-04-15 13:35:25 2855

原创 关于网络结构输出层加了softmax后,loss训练不下降的问题

小白第一次写,很多地方会显得比较生疏……首先记录的是为什么多分类问题中需要用softmax+crossentropyloss交叉熵函数的配合。交叉熵本质上是衡量输入与输出之间的区别,其值越小,则区别越小,毕竟从名字上看,熵就是衡量一种混乱程度嘛。在多分类问题中,我们通常会将输入的标签编码为one-hot形式,形如[0,0,1,0,0],则此数据属于数据集中的第三类。这是交叉熵函数的输入之一。在我们训练的神经网络最后一层,我们通常会使用一个全连接层,其输出维度就是我们类的总个数。假定输..

2022-04-10 21:29:39 5421 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除