自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 Latex Beamer 学习记录

例如,在这个列表中,我们告诉每个列表项它应该首先出现在哪个幻灯片上,然后使用破折号告诉它们在幻灯片中的所有后续幻灯片上出现。如果使用的是 Warsaw,默认情况下用的是 shadow 外部主题,但是如果想要将顶部导航栏更改为树状结构,我们可以将其更改为 tree 主题。请注意,这个命令将影响其后的所有代码,所以如果我们想在演示的后面将其改回默认设置,我们可以简单地再次使用相同的命令,但关键字为。内容显示在整个模版的底部左边作者旁边(一般是机构/学校的简写,显示的时候会加个括号),这个块的颜色是蓝色。

2024-03-16 23:05:36 1341

翻译 A Recipe for Training Neural Networks 博客翻译

不需要总结,动手去做吧。

2023-02-20 16:54:07 185

原创 基于 librosa 的 LFCC 和 CQCC 特征提取

本文实现了基于 librosa 的 LFCC 和 CQCC 特征提取,主要参考 librosa 中 MFCC 特征提取的过程,同时使用 torchaudio 来验证 LFCC 的正确性,使用 matlab 来验证 CQCC 的正确性。

2023-02-08 21:38:21 3115

原创 torchaudio 和 librosa 库中提取 Mel Spectrogram 的相互转换

torchaudio 和 librosa 是深度学习中语音特征提取最常见的两个库,但是针对同样的特征两个库在提取 MelSpectrogram 特征的时候,得到的结果并不完全一致,这篇文章简述了一些配置和注意事项,从而使得两个库能够提取相同数值大小的特征。

2023-02-08 20:19:43 1384

原创 语音中各种特征之间的关系

常见语音特征之间的关系。

2023-02-06 23:35:57 141

翻译 A Review of Speaker Diarization- Recent Advances with Deep Learning 综述 ——简化&翻译

A Review of Speaker Diarization- Recent Advances with Deep Learning 综述 ——简化&翻译

2022-11-10 22:57:14 801

原创 torch 中的 stft、torchaudio 中的 Spectrogram、Melscale、MelSpectrogram 的使用

torch 中的 stft、torchaudio 中的 Spectrogram、Melscale、MelSpectrogram 的使用

2022-07-27 16:10:06 9653 1

原创 transformer 细节理解

d_model 是什么d_model 是one_hot 向量经过 word embedding 之后的词向量维度。batch normalization 和 layer normalization 的区别batch normalization 是在batch维度,对输入的多个样本进行归一化;layer normalization 是在输入向量的维度,对样本自身的所有 features 进行归一化。为什么要 padding因为每个 batch 的输入序列的长度不一样,这样子网络无法进行处..

2021-11-11 17:51:59 4004 1

原创 An unexpected error has occurred. Conda has prepared the above report. 解决办法

使用 miniconda 创建虚拟环境的时候,报错:An unexpected error has occurred. Conda has prepared the above report.网上找了很多方法,都是说:方法一执行 conda clean --packages && conda clean --all && conda update --all方法二删除这个文件C:\Users[user_name].condarc上述方法可能可以,但是如

2021-11-08 21:57:05 7323 6

原创 理解 word2vec

本文是个人对 word2vec 的理解,同时参考了网上很多blogs,都列在References中了。注:文中数学公式,不加粗小写代表标量值,加粗小写代表向量,加粗大写代表矩阵。1. word2vec 简介Word2Vec是Google在2013 年开源的一个词向量(Word Embedding)计算工具,其用来解决单词的分布编码问题。它通过从大量文本预料中以无监督方式学习语义知识型,被广泛地应用于自然语言处理中。2. 什么是word embedding(词嵌入)我们知道,文本是一种非结构化的.

2021-10-25 20:19:13 351

原创 理解RNN和LSTM

理解RNN和LSTM  本文是台大李宏毅教授ML2020课程笔记。同时参考了其他博客。网上关于RNN和LSTM的blogs太多了,本文只是摘抄+笔记。1. RNN  RNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络。所谓序列,通常除了数据维度以外,还存在广义的时间维度,即序列是有顺序的,反应了数据随着时间的变化状态,例如,一串语音信号、一段文本或者一段视频都是序列。1.1 RNN结构  传统的前馈神经网络包含输入层、输出层和隐藏层,通过激活函数控制输

2021-10-18 11:34:26 520

原创 从贝叶斯分类到logistic regression

从贝叶斯分类到logistic regression笔者注:本文是台湾李宏毅教授机器学习第四章的学习笔记,其中大部分为数学推导。第四章主要讲分类问题。给定一个输入 xxx,目的是寻找一个function,使得当该function作用于 xxx 时,能够输出x所属的类别。问题描述我们首先考虑一个二分类问题,即 xxx 要么属于 class C1C_1C1​,要么属于class C2C_2C2​,设 PPP 表示概率,那么一个理所应当的分类效果为,把 xxx 分类到所属概率最大的那一类。用数学公式表示为

2021-10-12 15:51:53 165

原创 numpy常用函数

numpy模块常用函数及解析numpy作为python数据处理最常用的模块被广泛使用。本文总结了日常使用过程中numpy常用的函数及其用法(长期更新)。import numpy as np1. 数学运算1.1 取对数 np.log()对其中的每个元素取自然对数。numpy.log(x, /, out=None, *, where=True, casting='same_kind', order='K', dtype=None, subok=True[, signature, extobj])

2021-10-11 11:55:00 2955

原创 正则化(regulation)和归一化(normalization)

之前经常将正则化和归一化这两个概念搞错,特写此文,防止再次出错。1. 归一化(normalization)归一化的作用是去除数据的量纲,或者说将数据的value转换到同一个数量级或者限制在某一范围之内。1.1 max-min归一化即通过x所在的数据集的最大和最小值对x进行归一化:x′=x−xmin⁡xmax⁡−xmin⁡x^{'}=\frac{x-x_{\min }}{x_{\max }-x_{\min }}x′=xmax​−xmin​x−xmin​​其中,xmin⁡x_{\min }xmi

2021-10-07 16:58:45 3179 1

翻译 人群密度估计--论文阅读:DM-Count

DM-Count 论文阅读概述解析总结概述论文地址GitHub开源代码地址摘要在人群计数中,每个训练图像都包含多个人,每个人都用点标记。 现有的人群计数方法需要使用高斯平滑每个带注释的点或估计给定带注释点的每个像素的可能性。 在本文中,我们表明将高斯方法强加于注释会损害泛化性能。 相反,我们建议使用“分布匹配”进行人群计数(DM计数)。 在DM-Count中,我们使用最佳运输(OT)来测量归一化预测密度图和归一化地面真实密度图之间的相似度。 为了稳定OT计算,我们在模型中包括总变化损失。 我们证

2020-12-11 19:34:26 3789

原创 OPENVINO入坑笔记1--linux上安装OPENVINO

openvino入坑安装笔记-基于官网教程官方教程地址安装准备安装openvino核心组件安装外部软件依赖设置环境变量==永久设置openvino环境变量(可选部分)==配置模型优化器运行验证脚本来验证安装参开资料系统版本:官方教程地址linux安装(推荐用linux安装,环境较windows干净很多,省不少事)windows安装(不推荐,个人安装过,由于电脑python版本很乱,一堆问题)本教程基于linux-ubuntu-18.04-LTS操作系统,openvino版本为目前最新的2021

2020-11-12 22:11:24 2092 1

翻译 人群密度估计--论文阅读:CrowdNet

论文概述:CrowdNet论文地址:CrowdNet: A Deep Convolutional Network for Dense Crowd Counting官方源码:deep-crowd-counting这篇文章中,作者提出了一种新的基于深度学习的静态图像人群密度检测的网络框架。结合深层网络(deep network)和浅层网络(shallow network)预测给定图像的密度图。算法基于UCF_CC_50 数据集测试,取得了当时最好的结果。论文解析1. 背景检测人群拥挤和堵塞确定人

2020-10-12 20:01:56 1378

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除