声音类型分类之初步

嗨,接着回家前的工作继续做,如今还是这个问题。

目前主要做声音的分类,暂时不做场景分类,DCASE上有场景的分类,比如下图,2019年的DCASE某个task

also there is h5 model trained by the author,but maybe not helpful for my sound classification.

just get the feature of waveform,Let me try.

the feature is mel Spectrum,mel bin is 40,time length is 500, model is based CNN.

If the datasets are enough big ,could I use the trained model for transfer learning ?

First just recognize the voice/talk of person,background music,singing by person and no sound,then will recognize the music's category ,Now will look for some references for music classification. 

found two models for GTZAN dataset,even though the class precision is not enough well, but maybe could be embedding,we just want the high-features before softmax,is right ?160D low and high feature ?

 

另外有相关问题可以加入QQ群讨论,不设微信群

QQ群:868373192 

语音图像视频深度-学习群

 

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小李飞刀李寻欢

您的欣赏将是我奋斗路上的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值