![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 89
BarbaraChow
关注语音 & 语言
展开
-
数据操作之 Normalize / Standardize / Rescale
为什么用、怎么用、什么时候用 Should You Normalize / Standardize / Rescale Your Data?翻译 2024-03-06 21:56:16 · 259 阅读 · 0 评论 -
生成模型之扩散模型DDPM
Diffusion model原创 2023-12-20 19:39:09 · 2432 阅读 · 0 评论 -
相似度度量(Similarity Measurement)方法总结
相似性度量方法转载 2023-09-21 10:44:11 · 2375 阅读 · 1 评论 -
语音基石模型Speech Foundation Models
语音自监督学习模型。原创 2023-07-23 17:24:21 · 1364 阅读 · 0 评论 -
通俗易懂生成对抗网络GAN原理(二)
GAN背后的理论原创 2023-07-05 17:30:44 · 869 阅读 · 0 评论 -
语音合成技术入门之Tacotron
学习李宏毅课程。输入文字,输出语音。原创 2022-11-23 22:48:02 · 3612 阅读 · 0 评论 -
PPG & Phoneme Embedding & word Embedding总结
word embedding简单翻译就是词嵌入,是NLP自然语言处理中对单词处理的一种方式。就是将自然语言表示的单词转换为计算机能够理解的向量或矩阵的形式。这种技术会把单词或者短语映射到一个n维的数值化向量,核心就是一种映射关系。词嵌入由于要考虑多种因素比如词的语义(同义词近义词)、语料中词之间的关系(上下文)和向量的维度(处理复杂度)等等,我们希望近义词或者表示同类事物的单词之间的距离可以理想地近,只有拿到很理想的单词表示形式,我们才更容易地去做翻译、问答、信息抽取等进一步的工作。转载 2022-11-06 22:28:44 · 707 阅读 · 0 评论 -
Pytorch语音信号处理常用函数总结
语音预处理常用pytorch函数原创 2022-10-02 11:38:39 · 1097 阅读 · 0 评论 -
生成模型和判别模型学习
在机器学习中,一般将学习方式分为和方式。和。任务:识别一个语音属于哪种语言。现在一个人和你说了一句话,你需要识别出他说的到底是汉语、英语还是法语等。用生成模型的方法是学习每一种语言,你花了大量精力把汉语、英语和法语等都学会了,我指的学会是你知道什么样的语音对应什么样的语言。然后再有人过来对你说话,你就可以知道他的语言对应什么语言;用判别模型的方法是不去学习每一种语言,你只学习这些语言模型之间的差别,然后再分类。意思是指我学会了汉语和英语等语言的发音是有差别的,我学会这种差别就好了。...转载 2022-08-31 16:58:52 · 1248 阅读 · 0 评论 -
通俗易懂生成对抗网络GAN原理(一)
生成式网络有什么特别的地方呢?之前我们学到的神经网络就是一个函数,输入一个向量x(序列,图片,文本…),输出一个y(数值,类别,序列…)现在特别的地方就是,不仅输入x,还得输入一个随机变量z,z是从某一个分布中取样出来的,所以每次取样出来的z都是随机的。但要求这个z的分布够简单,就是你知道它的概率分布的公式是什么,比如高斯分布。为什么输入要额外有个z呢?......原创 2022-08-22 19:23:42 · 2557 阅读 · 1 评论 -
通俗易懂——VAE变分自编码器原理
学习李宏毅的机器学习课。原创 2022-08-19 22:45:33 · 2041 阅读 · 0 评论 -
Tensorflow一些常用函数
Tensorflow 进阶学习学习一个GAN网络代码,在train函数中,出现了如下调用tf的函数: def train(self): update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)#以便在每一次训练完后及时更新BN的参数1、 tf.train.AdamOptimizertf.train.AdamOptimizer()函数是Adam优化算法:是一个寻找全局最优点的优化算法,引入了二次方梯度校正。tf.train.Ad转载 2022-05-16 21:49:32 · 2338 阅读 · 0 评论 -
tacotron2 & 注意力机制 & self-attention学习
我们在机器翻译、语音识别、语音合成、语音转换等任务中,常常需要对序列数据进行处理,传统的方法不但繁琐且效果有限,目前常见的端到端seq2seq方法很值得学习。1. 序列到序列序列到序列最早应用于机器翻译领域,后面推广到语音合成等领域。该模型是针对输入和输出序列长度不相同的情况下,即建模两种不同域的映射关系。序列到序列包含编码器(encoder)和解码器(decoder)两个部分。编码器和解码器常用LSTM等网络构成,将一个域的序列转换到另一个域的序列。编码器网络负责接收源句子的embedding.转载 2021-12-14 11:57:35 · 767 阅读 · 0 评论 -
Ubuntu, python, CUDA, cuDNN, 驱动, GCC ....的对应关系
1.查看自己ubuntu版本https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html2.对应的tensorflow版本https://tensorflow.google.cn/install/source#linux3. CUDA下载地址https://developer.nvidia.com/cuda-toolkit-archive原创 2021-09-28 11:58:18 · 221 阅读 · 0 评论 -
Pytorch入门学习
Pytorch 基本概念张量(Tensor)PyTorch 张量(Tensor),张量是PyTorch最基本的操作对象,英文名称为Tensor,它表示的是一个多维的矩阵。比如零维是一个点,一维就是向量,二维就是一般的矩阵,多维就相当于一个多维的数组,这和numpy是对应的,而且 Pytorch 的 Tensor 可以和 numpy 的ndarray相互转换,唯一不同的是Pytorch可以在GPU上运行,而numpy的 ndarray 只能在CPU上运行。常用的不同数据类型的 Tensor 如下:3转载 2021-07-11 16:32:03 · 1087 阅读 · 1 评论 -
深度学习入门——波士顿房价预测
基于神经网络模型的波士顿房价预测波士顿房价预测是一个经典的机器学习任务,类似于程序员世界的“Hello World”。以“波士顿房价预测”任务为例,我们学习如何使用Python语言和Numpy库来构建神经网络模型。波士顿地区的房价受诸多因素影响。该数据集统计了13种可能影响房价的因素和该类型房屋的均价,期望构建一个基于13个因素进行房价预测的模型,如下所示。对于预测问题,可以根据预测输出的类型是连续的实数值,还是离散的标签,区分为回归任务和分类任务。因为房价是一个连续值,所以房价预测是一个回归任务。转载 2021-04-21 15:21:27 · 14701 阅读 · 2 评论 -
深度学习入门——基本概念
三个大概念深度学习是机器学习领域中神经网络分支的发展。机器学习观察现象,发现规律,假设模型,设计评价指标(损失loss),通过评价指标找到模型最优解的过程叫做优化。深度学习传统机器学习:人工特征提取(靠人的经验)简单模型:机器学习模型,没有对数据进一步提取深度特征的能力深度学习最基本概念–神经网络...转载 2021-04-20 11:01:49 · 117 阅读 · 0 评论 -
序列模型基础学习
序列模型简介常见有很多序列问题,如语音识别,金融上的,机器翻译,情感识别,计算机视觉,自然与然处理NLP等等很多。其中自然语言处理的输入输出基本上都是序列,序列问题是自然语言处理最本质的问题。1. 序列模型类型序列模型:就是输入输出均为序列数据的模型,序列模型将输入序列数据转换为目标序列数据。一对多,多对一,部分多对多,完全多对多1. 经典的seq2seq模型seq2seq是序列问题中一个非常重要的模型,很多的序列问题都可以用seq2seq来解决,比如说机器翻译、语音转文字、图像标注、文转载 2020-12-17 10:59:00 · 597 阅读 · 0 评论