将中文字符串写入json数组，构造语音识别需要的字典

最新推荐文章于 2022-08-21 20:18:54 发布

二米sy

最新推荐文章于 2022-08-21 20:18:54 发布

阅读量246

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43512125/article/details/115011307

版权

1.首先获得音频相应的翻译，格式如下：
在这里插入图片描述
2.分割语句，获得字符：

 def count_manifest(counter, manifest_path):
    with open(manifest_path, 'r', encoding='utf-8') as f:
        for line in f.readlines():
            for char in line.replace('\n', ''):
                counter.update(char)

3.将字符排序后写入列表，最后将列表写入json文件：

count_manifest(counter, args.manifest_path)

    count_sorted = sorted(counter.items(), key=lambda x: x[1], reverse=True)
    with codecs.open(args.vocab_path, 'w', 'utf-8') as fout:
        labels = [‘?’]
       
        
        for char, count in count_sorted:
            if count < args.count_threshold: break
            labels.append(char)
        json.dump(labels, fout)

4.注意：label 列表的第一个字符应该设为空字符，以便于ctcdecode识别。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
将中文字符串写入json数组，构造语音识别需要的字典

1.首先获得音频相应的翻译，格式如下：2.分割语句，获得字符： def count_manifest(counter, manifest_path): with open(manifest_path, 'r', encoding='utf-8') as f: for line in f.readlines(): for char in line.replace('\n', ''): counter.update(char)
复制链接

扫一扫

二米sy CSDN认证博客专家 CSDN认证企业博客

码龄6年

13: 原创

21万+: 周排名

71万+: 总排名

2万+: 访问

: 等级

180: 积分

3: 粉丝

28: 获赞

14: 评论

53: 收藏

私信

关注

热门文章

最新评论

解决jupyter一画图内核崩掉的问题
勒布朗凉尘: 在某些情况下，特定的库或软件可能会在加载时出现冲突或错误，导致程序崩溃或内核挂掉。通过设置环境变量"KMP_DUPLICATE_LIB_OK"为"TRUE"，可以解决一些库加载冲突导致的问题，允许重复加载相同的库，从而避免程序崩溃或内核挂掉。这种设置通常用于解决一些特定的软件或库之间的冲突，确保它们能够正确加载并协同工作。通过设置这个环境变量，可以改变库加载的默认行为，使得重复加载相同的库不再引发错误，从而确保程序的正常运行。
解决jupyter一画图内核崩掉的问题
勒布朗凉尘: 在某些情况下，特定的库或软件可能会在加载时出现冲突或错误，导致程序崩溃或内核挂掉。通过设置环境变量"KMP_DUPLICATE_LIB_OK"为"TRUE"，可以解决一些库加载冲突导致的问题，允许重复加载相同的库，从而避免程序崩溃或内核挂掉。这种设置通常用于解决一些特定的软件或库之间的冲突，确保它们能够正确加载并协同工作。通过设置这个环境变量，可以改变库加载的默认行为，使得重复加载相同的库不再引发错误，从而确保程序的正常运行。
Torch安装，Torchaudio 安装
月伴星如昨！: (yinpin) C:\Users\XYHe>pip install torchaudio==0.6 -i http://pypi.douban.com/simple/ Looking in indexes: http://pypi.douban.com/simple/ ERROR: Could not find a version that satisfies the requirement torchaudio==0.6 (from versions: 0.8.0, 0.8.1, 0.9.0, 0.9.1, 0.10.0, 0.10.1, 0.10.2, 0.11.0, 0.12.0, 0.12.1, 0.13.0, 0.13.1) ERROR: No matching distribution found for torchaudio==0.6 请问这是为什么呀
解决jupyter一画图内核崩掉的问题
daisy_hui_shi: NB，的确可以，但是什么原因呢？
ffmpeg安装（python篇）
Mr Jackin: 牛逼，给博主点赞

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。