深度学习
Zero_to_zero1234
Be objective
展开
-
简单的音频能量和rmse计算方法
音频能量计算、rmse计算及简单画图原创 2022-07-15 16:53:17 · 1784 阅读 · 0 评论 -
wsl2 安装pytorch异常记录
wsl2 使用pytorch原创 2022-06-27 03:21:13 · 2848 阅读 · 0 评论 -
python获取音频时长的方法
import librosaimport waveimport contextlibimport eyed3from pydub import AudioSegment def get_duration_mp3(file_path): """ 获取mp3音频文件时长 :param file_path: :return: """ mp3Info = eyed3.load(file_path) return mp3Info.info.tim原创 2021-12-15 10:56:50 · 13249 阅读 · 0 评论 -
get tensor value: model/inference/Max_1 must be Const
Describe the bugI have noticed that xxx must be const is a known issue, but I also found a PR which says ONNX has supported dynamic padding, but I still got the following error:OP=PadName=some/path/to/op/PadInputs: some/path/to/op/concat:0=Co原创 2021-11-12 17:14:34 · 1525 阅读 · 0 评论 -
如何查看 ananconda 的环境(虚拟环境)安装包位置
如何查看 ananconda 的环境(虚拟环境)安装包位置一般情况下,是在 /usr/local/anaconda3/envs/aaa/lib/pythonx.x/site-packages/bbbaaa 为env名称, bbb 为包名比如找 虚拟环境名为 nlp 中的 librosa :即/usr/local/anaconda3/envs/nlp/lib/python3.x/site-packages/librosa...原创 2021-09-25 14:40:35 · 14615 阅读 · 1 评论 -
【Ubuntu】Ubuntu 18.04 LTS 更换国内源——解决终端下载速度慢的问题
https://zhuanlan.zhihu.com/p/61228593转载 2021-09-09 12:43:44 · 386 阅读 · 0 评论 -
pytorch2onnx, tf2onnx及onnx相关博客
ONNX算子支持列表:https://zhuanlan.zhihu.com/p/338030833libonnxonnx2pytorch和onnx-simplifier新版介绍:https://cloud.tencent.com/developer/article/1799085tensorflow, ckpt 转 pb 并进行预测https://zhuanlan.zhihu.com/p/73449431部署环境之:tf2onnx - Convert TensorFlow models to原创 2021-09-07 15:30:47 · 1322 阅读 · 0 评论 -
onnx相关技术博客记录
ONNX初探:https://mp.weixin.qq.com/s?__biz=MzA4MjY4NTk0NQ==&mid=2247492739&idx=1&sn=8b5b57089833edcb92e7ddcd7f8516c5&scene=21#wechat_redirectONNX 再探https://mp.weixin.qq.com/s?__biz=MzA4MjY4NTk0NQ==&mid=2247493044&idx=1&sn=bb4c2a原创 2021-09-07 15:12:41 · 153 阅读 · 0 评论 -
Tensorflow加载预训练模型的特殊操作
本文转载自:https://blog.csdn.net/huachao1001/article/details/110957491?spm=1001.2014.3001.5501本文介绍一些不常规的操作:如何只加载部分参数? 如何从两个模型中加载不同部分参数?当预训练的模型的命名与当前定义的网络中的参数命名不一致时该怎么办?1 只加载部分参数举个例子,对已有的网络结构做了细微修改,例如只改了几层卷积通道数。如果从头训练显然没有finetune收敛速度快,但是模型又没法全部加载。此时,只需将未修转载 2021-05-15 17:22:47 · 287 阅读 · 0 评论 -
常用的音频处理库介绍
1、librosa算是一个比较全面的音频处理库,可以用于音频读取、音频播放、时频转换、滤波、特征提取、计算歌曲节拍、相似度计算、绘制mel频谱等等,算是一个功能完备而使用方便的库。使用说明:https://blog.csdn.net/zzc15806/article/details/79603994官方文档:http://librosa.github.io/librosa/index.html2、pyworld是一个高性能的声码器,用于将一段speech音频分离成基频(f0)、谐波谱包络和非周期谱包络原创 2021-01-25 17:00:11 · 1916 阅读 · 0 评论 -
python多张PNG生成GIF动图
安装:pip install imageio具体代码import osimport imageio def create_gif(image_list, gif_name): frames = [] for image_name in image_list: if image_name.endswith('.png'): print(image_name) frames.append(imageio.imrea原创 2020-12-31 12:25:12 · 962 阅读 · 2 评论 -
TensorFlow:怎么替换或者修改梯度?
问题:我想要去替换或修改 TensorFlow 中一个 op 或 部分计算图的梯度,该怎么整?在某些情况下,这和 tf.stop_gradient() 是相对的:我们想要的不是“添加一个 op,然后在计算梯度的过程中忽略该 op”,我们想要的是“只在梯度计算时起作用(I want a calculation which is only used when calculating gradients)”一个简单的例子如下:在不改变前向传播的情况下,通过给梯度乘以一个常量来缩放梯度。另一个原创 2020-12-28 20:15:38 · 767 阅读 · 0 评论 -
ModuleNotFoundError: No module named ‘sonnet‘
碰到一个奇怪的bug,应该是tensorflow依赖库sonnet 没有安全安装尝试:pip install sonnet如果不行:pip install dm-sonnet如果还不行,tensorflow是gpu的情况下:pip install dm-sonnet-gpu==1.23原创 2020-09-27 11:12:21 · 1091 阅读 · 0 评论 -
使用jupyter notebook链接服务器后,打不开 wav的一个简单解决办法
使用jupyter notebook链接服务器后,打不开 wav 怎么办:进入配置文件vim ~/.jupyter/jupyter_notebook_config.py修改jupyter notebook --NotebookApp.disable_check_xsrf=True以上可能有效原创 2020-09-16 15:33:41 · 468 阅读 · 0 评论 -
tensorflow静态图机制简介
参考up: https://www.bilibili.com/video/BV1h54y1U7oD?from=search&seid=4406165832725710983使用 sess.run(relu),那么会根据 relu必相关的操作和节点,进行运算,无关的会忽略placeholder表示该位置的值由外部传入,在使用 sess.run的时候,需要 提供 feed_dict参数tf.Variable表示可训练参数参与运算的数据是Tensor(不是 Variable、op等)原创 2020-08-31 20:09:37 · 2395 阅读 · 0 评论 -
tensorflow实现将ckpt转pb文件
最近用到tf1.14中 ckpt 转 pb 操作,记录一下:https://blog.csdn.net/guyuealian/article/details/82218092https://www.cnblogs.com/wj-1314/p/11289619.html原创 2020-08-27 16:09:35 · 206 阅读 · 0 评论 -
语音前沿的一些博客mark
语音前沿的一些博客mark:https://zhuanlan.zhihu.com/speech-synthesishttps://zhuanlan.zhihu.com/p/106943196https://zhuanlan.zhihu.com/p/145201426https://zhuanlan.zhihu.com/p/133388563原创 2020-08-04 16:06:33 · 177 阅读 · 0 评论 -
VAE的原理和代码实现
VAE的原理和代码实现重要参考:https://spaces.ac.cn/archives/5253https://www.jianshu.com/p/ff28eef92fa1VAE(Variational Autoencoder)中文译为变分自动编码器,它是一种深度生成模型(Deep Generative Model),是一种无监督学习算法。那么VAE的设计思路来源是什么?VAE能干嘛?代码如何实现?以及还可以怎样改进呢?下面一一道来。1、VAE的设计来源2、VAE的主要思路3原创 2020-08-04 14:38:59 · 11651 阅读 · 0 评论 -
简谈一维卷积
二维卷积在tf中是tf.layers.conv2d(),而一维卷积:tf.layers.conv1d()1、一维卷积和二维卷积的区别二维卷积就不赘述了,很多博客写的很好,自己之前也马虎写过一篇,主要讲一下一维卷积。先讲一下二维卷积和一维卷积的区别,二维卷积是将一个特征图在width和height两个方向进行滑动窗口操作,对应位置进行相乘求和;而一维卷积卷积略有不同,其卷积核也是一个二维的,只是在width(lenth)单方向上进行滑动窗口并相乘求和。来自:博客还有有一篇博客写得比较好博客:ht原创 2020-07-31 18:20:12 · 24855 阅读 · 9 评论 -
tf2常用api总结(持续更新)
本文主要对NLP和TTS中常用到的tensorflow2部分api进行总结和记录,熟能生巧!一、tensor相关操作1、tf.reshapetf.reshape(tensor, shape, name=None)重新构造向量形状原创 2020-07-22 18:02:04 · 742 阅读 · 0 评论 -
Linux系统添加更换国内软件
参考自: Linux系统添加更换国内软件, 知乎: https://zhuanlan.zhihu.com/p/122214146Ubuntu的如下:1.备份sudo cp /etc/apt/sources.list /etc/apt/sources_init.list将以前的源备份一下,以防以后可以用的。2.更改文件权限使其可编辑sudo chmod 777 /etc/apt/source.list3.更换源sudo nano /etc/apt/sources.list使用na转载 2020-07-21 15:37:46 · 229 阅读 · 0 评论 -
简单记录梯度反转:Gradient Reversal Layer
参考知乎文章:https://www.zhihu.com/question/266710153, https://blog.csdn.net/qq_30091945/article/details/104478550#commentBox后续对 VAE和GAN有更深入的理解,再进行扩展和补充转载 2020-07-20 14:16:11 · 2643 阅读 · 0 评论 -
Tacotron2讲解
参考博客:https://blog.csdn.net/whjkm/article/details/89321954#commentBoxhttps://blog.csdn.net/yunnangf/article/details/79585089github代码:https://github.com/NVIDIA/tacotron2一、模型结构模型结构上,tacotron2与tacotron基本类似,除了CBHG结构和Griffin结构上略有区别Tacotron:Tacotron2:二原创 2020-07-07 17:10:54 · 9033 阅读 · 0 评论 -
深度学习论文专栏
深度学习论文专栏以下,建立论文阅读专栏,一是为提高论文阅读能力,二是为保证知识更新,三是为了记录和传播好的论文思想以下仅做粗浅分类,方便查阅一、NLP1、Transformers are RNNs: Fast Autoregressive Transformers with Linear Attention 【https://arxiv.org/pdf/2006.16236.pdf】2020新作待读二、语音1、三、其他1、...原创 2020-06-30 11:56:03 · 861 阅读 · 0 评论 -
深度学习论文常见单词积累
持续更新…常见单词:incorporate 包括scale 规模scale up 放大,增加adversarial 对抗的overlap 交叉,交叠disjoint. 不连贯disentangle 解开,分解optionally 可选的setup 安装、设置clips 段、剪辑Incorporating 合并explicit 清晰、清楚的,明白的moderate 适度的,谦虚的demonstrate 证明了augment 增加implicitly 含蓄地,隐原创 2020-06-28 20:30:25 · 626 阅读 · 0 评论 -
语音信号处理流程总结
一、语音合成、识别中不可避免在做语音合成、语音识别过程中,难以避免的会涉及到语音信号知识,通过对多篇博客的阅读和理解,作以下总结:二、大致流程根据 zouxy09博客 ,知道大致预处理流程如下:接下来再进一步对各个环节进行进一步说明三、预加重、分帧和加窗根据 语音加窗分帧处理四、STFT和声谱图,梅尔频谱(Mel Bank Features)与梅尔倒谱(MFCCs)根据博客:(https://blog.csdn.net/qq_28006327/article/details/591291原创 2020-06-28 14:39:34 · 5901 阅读 · 0 评论 -
python对音频文件进行重采样
一、ffmpegpip install python-ffmpeg简单代码:import ffmpegffmpeg.input('input.mp3').output('output.mp3', ar=16000).run()二、librosa库import librosa# to install librosa package# > conda install -c conda-forge librosa filename = 'ClapSound.wav'newFile原创 2020-06-08 14:09:50 · 3461 阅读 · 3 评论 -
迁移学习之Domain Adaptation
关于迁移学习的两篇文章,先简单记录一下,后面再进行补充https://chenrudan.github.io/blog/2017/12/15/domainadaptation1.htmlhttps://blog.csdn.net/weixin_37993251/article/details/89398433原创 2020-06-05 10:53:46 · 1345 阅读 · 0 评论 -
VAE全面理解
【学习笔记】生成模型——变分自编码器原创 2020-06-04 15:59:07 · 850 阅读 · 0 评论 -
pytorch报错 ConvTranspose1d object has no attribute padding_mode
‘ConvTranspose1d’ object has no attribute 'padding_mode’错误:https://github.com/NVIDIA/tacotron2/issues/182解决方法:Using torch 1.1.0.dev20190512 and waveglow_256channels.pt I was still getting this error. Following @apsears I managed to get it working. Here a原创 2020-06-04 10:25:48 · 1272 阅读 · 1 评论 -
TensorBoard实现训练可视化
推荐:TensorBoard实现训练可视化https://zhuanlan.zhihu.com/p/84215973https://www.jianshu.com/p/321eb9d195cc原创 2020-05-25 11:59:08 · 361 阅读 · 0 评论 -
访问远程服务器的tensorboard
场景与问题tensorflow程序运行在远程服务器,tensorboard启动后访问地址为:0.0.0.0:6006。这样没法用自己机器上的浏览器访问tensorboard。解决办法1 . 连接ssh时,将服务器的6006端口重定向到自己机器上来:ssh -L 16006:127.0.0.1:6006 username@remote_server_ip其中:16006:127.0.0.1代表自己机器上的16006号端口,6006是服务器上tensorboard使用的端口。2 . 在服务器上使用转载 2020-05-25 10:07:18 · 846 阅读 · 0 评论 -
Failed to import pydot. You must install pydot and graphviz for pydotprint to work
Failed to import pydot. You must install pydot and graphviz for pydotprint to work的解决办法:pip install pydotpip install pydotplusapt-get install graphvizpip install graphviz更多参考:https://github.com...原创 2020-04-28 19:45:48 · 209 阅读 · 0 评论 -
tf.keras.layers.LSTMCell和tf.keras.layers.LSTM
tf.keras.layers.LSTMCell 在整个时间序列输入中处理一个步骤,而 tf.keras.layer.LSTM处理整个序列tf.keras.layers.LSTMCellAPI简介:tf.keras.layers.LSTMCell(units, activation=‘tanh’, recurrent_activation=‘sigmoid’, use_bias=True...原创 2020-04-22 10:15:11 · 9807 阅读 · 0 评论 -
@tf.function()相关
https://www.bookstack.cn/read/TensorFlow2.0/spilt.4.3b87bc87b85cbe5d.mdhttps://blog.csdn.net/qq_31456593/article/details/95041177转载 2020-04-17 17:38:17 · 676 阅读 · 0 评论 -
各种矩阵(向量)求导
一个准则:按照单变量求导来做,然后调整下维数就可以了。 比如 对矩阵的求导,结果一定是和矩阵维数一致才对今天早上遇到@tornadomeet在deep learning高质量群里问:一个列向量对一个列向量求导的结果,也就是下面的第一个公式:Y = A * X --> DY/DX = A’。我这才意识到矩阵里的很多知道又忘了,这些东西一旦不用,忘了就很快。矩阵和概率论的东西真心很重要,下...转载 2020-04-15 10:31:38 · 2753 阅读 · 0 评论 -
自然语言处理预处理数据迭代器及训练预测常用函数总结(fit_generator、build_model、checkpoint、predict_generator)
由于NLP相关数据处理和训练过程中,会经常用到相同代码,现常用模块进行记录,部分需要根据自己需求进行更改1、导入模块import kerasimport gensimfrom pathlib import Pathimport osimport numpy as npfrom keras.layers import *from keras.optimizers import SGD...原创 2020-04-01 20:04:32 · 1171 阅读 · 0 评论 -
极简使用gensim训练词向量
由于想要一个较小的词向量语言模型来做简单的文本分类(BERT模型太大),找了很多也没找到合适的,所以使用gensim训练 word2vec 模型,如果涉及词向量的简单使用时,而不参与模型训练,可以使用gensim库来提供计算比使用embedding层更加快捷,因为模型内部有查询优化,所以速度很快一、选取训练语料库https://github.com/brightmart/nlp_chinese...原创 2020-03-31 12:15:10 · 1476 阅读 · 2 评论 -
动手学深度学习学习笔记tf2.0版(6.6 循环神经网络的反向传播)
原创 2020-03-31 00:16:33 · 209 阅读 · 0 评论 -
jay chou歌词 文本下载数据下载
周杰伦歌词数据下载:链接: https://pan.baidu.com/s/1kxHWX4w15amjnKXBrjfE2w 提取码: hkr9原创 2020-03-31 14:12:42 · 1601 阅读 · 1 评论