PIT2017笔记

【论文】

Permutation Invariant Training of Deep Models for Speaker-independent Multi-talker Speech Separation,ICASSP 2017,Dong Yu @ Microsoft

【P.S.】

这个研究的主要贡献在于提出置换不变性训练PIT,使得端到端DNN方法用于多说话人+说话人无关的语音分离成为可能。当然PIT本身只解决permutation problem,关注的是训练问题,而没有限制是否一定要在变换域做分离(例如TasNet使用了PIT,但TasNet没有在变换域操作)

 

【0. 摘要】

直接最小化separation error来解决permutation problem,从而使得DNN可以用于multi-talker speaker-independent的说话人分离

【1. 引入】

较早的语音分离方法:

1. CASA

2. NMF

3. facotrial GMM-HMM

近来只有2种方法解决speaker-independent说话人分离里的permutation problem:

1. Weng方法

2. DPCL2016,问题:假设了每个T-F unit只属于1个说话人(因为聚类)

先前的方法只从2种角度看待语音分离:

1. multi-class regression:class-based方法在speaker-independent里出现的问题可以详见DPCL2016论文

2. clustering/segmentation:即DPCL2016的方法

而PIT2017重新从separation角度来看待speaker-independent multi-talker speech separation,即直接最小化separation loss。PIT首先决定assignment。然后最小化这个assignment的源估计误差,好处在于这个策略能够直接用nn实现(而不像DPCL2016要聚类),具体细节见【PIT】。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
GPT、STM和PIT都是定时器,但在不同的系统中有不同的应用场景和特点。 GPT是General Purpose Timer的缩写,是一种通用定时器,带有独立的预分频器。GPT的预分频器是独立于上一级时钟的,可以根据需要进行配置。其中,第一个预分频器是正常使用的,而第二个预分频器是为双时钟模式准备的,一般情况下不使用。对于GPT的配置,需要打开特定的宏。 STM代表System Timer,也是一种定时器。在一些系统中,STM可以用作coremark测试工程的定时器。然而,对于系统运行生命周期总计时器来说,PIT是更适合的选择。PIT拥有4个32位计时器,并且可以链接使用(串连)[2。因此,PIT在系统总计时方面的优势使其成为痞子衡在i.MXRT1050 coremark工程中的选择。 总而言之,GPT、STM和PIT都是定时器,但它们在不同的系统中有不同的应用和特点。具体的选择取决于系统需求和设计考虑。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [S32K3定时器(STM&PIT)使用——基于MCAL](https://blog.csdn.net/HeFlyYoung/article/details/124290730)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [痞子衡嵌入式:介绍i.MXRT定时器PIT的多通道链接模式及其在coremark测试工程里的应用...](https://blog.csdn.net/Henjay724/article/details/123039522)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值