![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习小白初探
文章平均质量分 75
Blossomers
这个作者很懒,什么都没留下…
展开
-
conda虚拟环境中升级pip版本问题
conda虚拟环境下pip升级版本问题的解决原创 2023-01-02 17:48:51 · 803 阅读 · 3 评论 -
Huffman编码及其实现[Python]
Huffman编码原理简述+实现原创 2022-07-15 14:07:39 · 1988 阅读 · 0 评论 -
MFCC学习记录
闲的没事就折腾呗~之前做的那个暴力检测感觉光用ResNet3D去做有点简单,现在想着要去融合一下音频数据,对于音频数据做MFCC之后再辅助检测一手,看看效果咋样~一、MFCC的基本概念就是从低频到高频的一组滤波器,经过这组滤波器输出的信号能量,经过进一步数字化处理后,既可作为输入信号的基本特征。STFT:就是在波形图上滑窗做FFT,得到频谱随着时间变化的信息,也就是一种时频分析的方法。记录:一些比较常用的音频处理工具Python librosa工具包..原创 2022-05-27 19:41:19 · 1644 阅读 · 2 评论 -
3DResNet 学习记录
近期同时在进行的两个深度学习项目都需要用到3DResNet模型,本着不做调包侠的心态,还是要好好把模型的原理看一看的。1、ResNet结构理解首先先理解一下二维的ResNet吧。原创 2022-05-12 17:16:32 · 8598 阅读 · 0 评论 -
Self-attention模块学习记录(附代码复现)
尝试一下以问答的形式,阐述自己对自注意力模型的理解。1、self-attention模块,输入与输出在通道数上是相同的,如何理解?这是由模块的计算方式所决定的。首先需要弄清楚的是,模块的输入可以看作是一个句子里的各个词组,比如说I love eating apples. 那输入就包括这四个单词,以及句子的结束标志'.' 经过embedding得到的特征向量。输出的是这个词组与其他词组的关联程度,也就是Z向量。从直观上看,这两者都是围绕着“一个词”所做的编码工作,那么在通道数目上自然是会相等的原创 2022-05-02 17:16:32 · 2889 阅读 · 0 评论 -
深度学习环境配置记录(pytorch+cudatoolkit)
配置cuda的一些记录,参考内容很有价值,有助于新手快速理解cuda及其他包的作用。原创 2022-04-15 13:35:25 · 2762 阅读 · 0 评论 -
关于网络结构输出层加了softmax后,loss训练不下降的问题
小白第一次写,很多地方会显得比较生疏……首先记录的是为什么多分类问题中需要用softmax+crossentropyloss交叉熵函数的配合。交叉熵本质上是衡量输入与输出之间的区别,其值越小,则区别越小,毕竟从名字上看,熵就是衡量一种混乱程度嘛。在多分类问题中,我们通常会将输入的标签编码为one-hot形式,形如[0,0,1,0,0],则此数据属于数据集中的第三类。这是交叉熵函数的输入之一。在我们训练的神经网络最后一层,我们通常会使用一个全连接层,其输出维度就是我们类的总个数。假定输..原创 2022-04-10 21:29:39 · 4799 阅读 · 4 评论