![](https://img-blog.csdnimg.cn/6b6ecbf1469a4a768cca4e40e6e929c0.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
求道
文章平均质量分 84
深度学习小白的苦逼探索岁月,没有人可以永远站在山顶
来点实际的东西
喜欢做一些无中生有的事情
展开
-
理解Difussion Model,以及遇到的一些问题
今天简单了解了一下扩散模型,主要是学习了最经典的那篇2020年发表的denoising diffusion probabilistic models(DDPM)。需要掌握一些高数基础、概率论以及KL散度相关的知识,数学公式推导起来才不至于费劲,而且里面的概率公式多是基于**贝叶斯公式**以及**马尔科夫假设**,运用的比较灵活,虽然数学原理推导不是很难,但是整个模型的理解会存在一些或大或小的问题,我将在这篇文章中记录一下我的一些疑惑,并尝试着去解答,欢迎大佬指出错误。原创 2022-12-10 00:08:36 · 2113 阅读 · 1 评论 -
torchaudio音频基础知识学习
这篇文章是我在入坑深度学习、语音合成(TTS)的基础知识的学习记录,其实期间遇到了不少令人费解的知识点,看了一些博客与文档,算是大致掌握了一些基础的知识,但其实比较细致的东西没有深究,但总体来说,对语音数据的表示有了更加深刻的了解,希望之后能够继续坚持下去。ps:本文只介绍了语音信号的几种表示形式,波形、语谱、梅尔频谱三种比较常见的表达方式,但其实像MFCC也比较常见,但并没有介绍,这里给出pytorch官网的一张图片,给一个概览,各种语音信号表示形式以及它们之间的转换。原创 2022-11-19 00:28:31 · 3349 阅读 · 0 评论 -
model.eval()和with torch.no_grad()
当网络中出现batch normalization或者dropout这样的在training,eval时表现不同的层,应当使用。原创 2022-11-09 20:44:47 · 2289 阅读 · 0 评论