自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 利用Python拼接多段音频

音频文件拼接的Python方法

2024-04-28 11:01:44 347

原创 MFA做中文语音文本对齐的教程

该数据集包括的音频数据的.wav格式正是与后面MFA输入格式所适配的,并且该数据集已经包含了我们后续所需要的与音频所对应的同样是用于MFA输入的拼音文本,只不过在后续用作MFA输入时,需要将TRN中的第二行复制,新建文本文件,粘贴内容,保存类型为.lab文件。更为一般的情况下,我们需要通过某些软件将音频格式转换为.wav格式,并且在此基础上,将音频文件转中文汉字txt文本处理(目前比较常用的方式是采集讯飞接口),之后在通过代码完成txt到.lab文件的转换(可参考以下链接中的第一步)。

2023-11-06 21:36:08 466 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除