从dataset说话人说明文件中得到键为说话人ID、值为对应性别ID的JSON文件

该脚本读取SPEAKERS.txt文件,针对train-clean-360数据集,筛选出男性(M)说话者的信息,将说话者ID与性别ID(1代表男性)存储为json格式,并保存为gender.json。
摘要由CSDN通过智能技术生成

origin:
在这里插入图片描述
target:
在这里插入图片描述
只要了train-clean-360的

import json
with open('SPEAKERS.txt', "r") as f:
    data = {}
    message = f.readlines()
    for i in message:
        dataset_name = i.split("|")[2].replace(" ", "")
        if dataset_name == "train-clean-360":
            sex = i.split("|")[1].replace(" ", "")
            if sex == "M":
                sex_id = 1
            else:
                sex_id = 0
            speaker_id = i.split("|")[0].replace(" ", "")
            data[speaker_id] = sex_id

json_data = json.dumps(data, ensure_ascii=False)
with open("gender.json", "w+") as ff:
    ff.write(json_data)



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值