panxin801-CSDN博客

任意人到任意人的VC目标是将源发音人的音色转换到目标发音人上，即便目标发音人和源发音人都是在训练时未曾出现的发音人。这是相比一对一，多对多更具有挑战的任务，而这也在现实场景中更加吸引我们，因为这个情况更加常见。在这个论文中作者团队提出了FragmentVC。使用Wav2Vec 2.0从源发音人语句中隐式提取音素结构。目标发音人的语谱特征使用log 梅尔谱。通过一个二阶段训练过程，可以将两个不同的特征空间中的隐式结构对齐。FragmentVC能够从目标发音人中提取细粒度的语音片段，然后将它们融合进期望的语音。

2022-11-01 15:26:24 726

原创 [Docker] Docker-compose 记录

docker-compose 命令记录

2022-10-06 09:19:53 302

原创 [Docker] Dockerfile 记录

dockerfile的使用以及镜像的产生

2022-10-05 18:55:38 436

原创 [Docker] Docker 记录

docker不常用基本命令记录

2022-10-05 10:54:48 529

原创 [Git] 系列三随意修改提交记录以及一些技巧

git 高级教程更难的部分

2022-09-18 20:24:42 451

原创 [Git] 系列二高级命令学习记录

git高级命令记录

2022-09-17 23:32:49 227

原创 [Git] 系列一基本命令学习记录

git基本命令学习笔记

2022-09-17 22:36:59 348

原创【Docker】容器内如何使用GPU资源

Docker container内如何使用GPU

2022-08-17 00:52:30 2517

原创【Leetcode】三路快排应用于75、88、215号问题

leetcode中75+88+215号问题使用三路快排思路的解法

2022-06-06 22:25:41 181

原创 5个激励自己做成任何事的心理技巧

如何做成更多的事还不会累？

2022-05-29 19:28:37 193

原创《格局》读书笔记

《格局》读书笔记Writer: 吴军Date: 2022.4.29一直比较喜欢吴军的书，能有一些收获。这次记录这本书给我带来的启发和知识。前言读完前言，对其中一些内容印象深刻。成功的人他们都十分清楚自己所在的位置，有非常明确的方向，然后用正确的方法沿着这个方向坚定地走下去。他们并不企图步伐有多大，但是因为从来不去做（或很少做）南辕北辙的事情，反而总是先人一步到达终点。相反，一事无成的人常常跑得很快，却在锲而不舍地兜圈子，或者受到环境的诱惑而不断改变方向，甚至干脆背道而驰，几年、十几年后回

2022-05-18 22:28:27 1250

原创使用Ngram融合多个语言模型

Ngram功能用于多个语言模型之间插值合并，以期望改善模型的效果模型插值参数：-mix-lm 用于插值的第二个ngram模型，-lm是第一个ngram模型-lambda 主模型（-lm对应模型）的插值比例，0~1，默认是0.5-mix-lm2 用于插值的第三个模型-mix-lambda2 用于插值的第二个模型（-mix-lm对应的模型）的比例，那么第二个模型的比例为1-lambda-mix-lambda2-vocab 当两个模型的词典不一样的时候，使用该参数限制词典列表，没有效果-limit

2022-05-12 09:28:20 924

原创【Leetcode】求和问题专题

【Leetcode】求和问题专题Author: Xin PanDate: 2022.4.27文章目录【Leetcode】求和问题专题【1】两数之和解析我的答案【167】两数之和 II - 输入有序数组解析我的答案【15】三数之和解析答案【18】四数之和解析答案这次总结一类问题即求和问题的解法。包括如下具体题目：两数之和两数之和2-输入有序数组三数之和四数之和接下来开始正文内容。【1】两数之和输入：输入的是一个非排序的数组nums，和一个目标值target。输出：和为targe

2022-04-27 10:29:57 293

原创【Leetcode】[190] 颠倒二进制位

Leetcode 190题思路

2022-03-15 00:15:37 1099

原创【Leetcode】[977] 有序数组的平方

【Leetcode】[977] 有序数组的平方Author: Xin PanDate: 2022.3.2题目原题链接给你一个按非递减顺序排序的整数数组 nums，返回每个数字的平方组成的新数组，要求也按非递减顺序排序。解法由于题目输入是排序的数组。这个时候可以考虑使用双指针技巧来解题。答案1执行用时: 20 ms 内存消耗: 26.4 MBclass Solution{public: vector<int> sortedSquares(vector&

2022-03-02 17:56:48 310

原创《黑天鹅》读书笔记

《黑天鹅》–如何应对不可预知的未来Writer：纳西姆·尼古拉斯·塔勒布Date: 2021.12.23黑天鹅其实最早来自澳大利亚发现的黑天鹅，在那之前人们认为天鹅都是白色的。黑天鹅指满足如下三个特点的事件：意外性，指时间的发生通常在预期之外，更具体来说是指没有任何能确定它发生的证据出现；产生极端影响；事后可解释性，虽然事件具有意外性，但是人们习惯于在事情发生之后为它的发生编造（或者说找）理由，使它变得可以解释和可以预测。而有意思的地方在于黑天鹅的逻辑是说，这个我们不知道的事比现在已经

2022-01-16 22:12:44 817

原创 Transformer怎么处理语音和文本Embedding维度失衡问题

transformer怎么处理语音和文本embeding维度失衡问题Author: Xin PanDate: 2021.10.28想起之前的一个问题，在语音识别中其实一个很明显的问题就是输入音频提了特征（Feat）以后维度会比较高，但是文本因为就那么些字，维度会比较少。那么它们之前在decoder上是如何产生关联关系的呢？假设现在的特征是Feat=[152,2,512]=[特征长度，batch，特征深度]，文本的tgt=[60,2,512]=[文本长度，batch，特征深度]乍看它们的维度不一样

2021-11-01 15:28:02 1223

原创 Self-attention中为什么softmax要除d_k

我觉得这是一个很有意思的问题，简单但是很细节。先说结论，是为了保证梯度的平稳。那怎么个意思？首先说向量（行向量和列向量都一样），他们的点乘和叉乘。向量的内积：也叫点乘，结果是一个数。两个向量对应位相乘再求和。要求向量a和b的维度要一样。a⃗∗b⃗=(a1∗b1+a2∗b2+⋯+an∗bn)\vec{a}*\vec{b}=(a_1*b_1+a_2*b_2+\cdots+a_n*b_n)a∗b=(a1∗b1+a2∗b2+⋯+an∗bn)内积的几何意义：计算两个向量之间的夹角或者向量b在向

2021-10-14 10:34:00 3796 6

原创《考试脑科学》读书笔记

读书笔记：考试脑科学Writer：池谷裕二（日本）Date：2021.9.25这本书还是挺有意思的，讲得算是脑科学吧。文章目录读书笔记：考试脑科学第一章记忆究竟是什么第二章 “欺骗”大脑的方法第三章海马体和LTP第四章不可思议的睡眠第五章模糊的大脑第六章天才的记忆机制第一章记忆究竟是什么人脑的记忆处理机制和计算机相似也是数字信号，因而人脑和计算机的相似点也就是都使用了二进制。人脑的记忆分为长期记忆和短期记忆，而海马体就是区分什么信息存储进长期记忆的分类员。红颜色让人畏惧恐惧，

2021-10-07 18:36:42 2200

原创《年轻人自救指南》读书笔记

读书笔记：年轻人自救指南Writer: 蔡澜Date: 2021.8.15年轻时总要吃点苦的谈到未来，年轻人医不好的就是没有自信但是还不肯上进，不肯努力本身极为平凡，收到比人的吹捧，没有胆量享受不符的成就。人生最大的投资莫过于培养自己本行之外的兴趣，专心研究称为副业。所谓狡兔三窟亦是如此。人在社会中活着，必然要钱。但是气焰也是需要的，气焰要内藏不应表露。年轻人没有了气焰就像是老人（也许摘录下作者这段话的我现在就像是老人，但是我已经在改变了），如果他们把愤怒化为了力量，才能学到嬉皮士的精神。学

2021-09-02 00:35:26 185

原创【笔记】Small-footprint Keyword Spotting Using Deep Neural Networks

SMALL-FOOTPRINT KEYWORD SPOTTING USING DEEP NEURAL NETWORKSDate: 2021.8.17Author: Xin Pan摘要我们的应用需要一个KWS系统，这个系统需要满足这些条件。内存占用小，计算消耗小，高精度。为了满足这些条件，我们提出了一个基于DNN的方法。训练一个直接预测关键词或者关键词字词单元的DNN，后边接一个后验概率处理方法产生最终的置信度得分。对比传统的HMM系统，该系统达到45%相对的性能提升，同时在babble噪声下达到3

2021-08-18 15:11:48 1109 7

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

en_us_cmudict_forward.pt

基于遗传算法的多旅行商问题Matlab

unzip-6.0-21.el7.x86_64.rpm

adult.data

zip-3.0-11.x86_64.zip

影像匹配VC++程序_改进

影像匹配VC程序

VS2010_Uninstall-RTM

arcgis10注册机

影像匹配VC++程序

空空如也