![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
文章平均质量分 82
极地语音工作室
这个作者很懒,什么都没留下…
展开
-
flask-admin学习笔记
近期在工作中需要维护若干个信息表,在这个过程中需要经常对表格进行操作、交叉操作、各个表格同步,和某平台信息同步。。。在此过程中需要建立一个“隐性”的流程,要第一步同步A和B,再同步B和C,。。。而检索更是痛苦,更夸张的是,有时候需要根据不同的需求,将表格的某一些部分拷贝出来。。。这可能是一个数据库(甚至是数据系统)的操作,不可否认可以通过其它N个方案实现,但是为了满足笔者这种web前后端菜鸟学习的欲望,还是发现了这个小小的项目,在里面找到一个相对比较简单和功能丰富的示例完成这个需求。需求:该项目来自http原创 2022-12-05 21:40:55 · 1194 阅读 · 0 评论 -
Praat脚本-027 | 通过基频曲线的距离做一个声调判别器
这里写目录标题使用背景如何做使用说明获取脚本关注公众号咨询QQ群关注版权说明使用背景我们已经知道如何利用Praat脚本提取基频,如果对使用Praat提取的基频是不是可用有疑问的可查看这篇文章(), 而如果不知道如何提取基频的可查看这篇文章()。今天我们来定义一个小小的应用,我们引进一个曲线距离的概念,来比较一下基频值,而基频值是直接反映声调或者语调的参考,那么我们研究一下是否通过曲线距离这个概念,能够对声调有所区分,可以定义为一个简单的声调分类器。作为尝试,我们使用的是中文普通话的数据,但是这样的参考原创 2022-04-10 12:55:49 · 3821 阅读 · 0 评论 -
Praat提取的基频可以工程应用吗?
`Praat`作为普通语音学习者的标注工具已经算是比较经典的工具了。近些年来,随着AI的兴起,神经网络的算法更新迭代也很迅速,这其中有一些算法会涉及到基频,也称为音高,这个参数的应用。而作为学习者在学习科研中,基频也是一个衡量声调或者语调的重要表现特征。今天的话题是想比较使用`Praat`提取的基频和两种工程应用级别提取的基频是否有比较大的差异,换句话说,如果使用`Praat`这个工具提取的基频,能做到工程应用吗?原创 2022-03-20 21:21:45 · 4206 阅读 · 1 评论 -
Python脚本处理标注文件和音频匹配个数问题
目录引题数据说明代码说明获取脚本关注版权说明引题在语音标注过程中,涉及大量的语音标注,尤其是有多人分工进行时,难免会出现很多不匹配的文件,标注类的文件(通常为*.TextGrid),和音频类(通常为*.wav),当两者出现个数不匹配的时候,无论是后期使用脚本提取参数,和运行某些工程类的模型,都会引起报错。本文针对Python初学者,提供一个简单的脚本,检查两类文件(不限于上述两类,脚本可用于其它的扩展名的两类文件)的不匹配状况。主要目的还是学习一下基本的检查目录里的文件的操作,适用于Python学习者原创 2022-03-17 18:12:32 · 5036 阅读 · 0 评论 -
Python实现文件/文件夹名按字符串排序或者按数字排序
如下图,获取sample_data路径下的文件夹名,其实这是我们希望得到的排序方式。实际上,当我们直接使用sort排序时,得到的是:import osinput_dir = r'./sample_data'file_list = os.listdir(input_dir)print(file_list)file_list.sort() # 文件名 按字符串排序print(file_list)得到的输出是:[‘file101.txt’, ‘file2.txt’, ‘file23.tx原创 2022-03-13 10:36:20 · 11747 阅读 · 0 评论 -
VS Code中使用Python相对路径问题
在VS Code环境运行Python脚本有一个困扰,举个例子:我的工作目录是/Python_Work,我在工作目录中创建了文件/Python_Work/Part-02/test.py, 并且运行test.py生成了file.txt文件:with open('file.txt', 'w') as f: f.write('HelloWorld')我们以为file.txt在/Python_Work/Part-02/路径下,和创建它的test.py在一个路径中。结果file.txt这个文件却在/Pyt原创 2022-03-13 10:05:17 · 1608 阅读 · 0 评论 -
Python处理有关语言学语音学脚本的项目【GitHub: Python-linguistic】
GitHub: Python-linguistics - 持续更新中项目地址:https://github.com/feelins/Python-linguistics这个项目主要和语言学专业的数据处理,包括但不限于语音、文本等方面,使用Python的一些脚本和技巧,同时也面向初学者,提供短小精悍的一些练手学习的脚本。欢迎关注公众号:极地语音工作室;CSDN博客:https://blog.csdn.net/shaopengfei说明:每一部分为一个主题,第一、第二部分适合初学者练手;第三部分为原创 2022-03-12 12:46:35 · 1397 阅读 · 0 评论 -
Ubuntu 20.04.3 Anaconda安装及Python多版本虚拟环境配置
目前最新的一些学习项目,都是基于Python 3 以上, 为了兼容有些稍老的项目,还是要使用Python2.7环境,查了一下,可以通过安装 Anaconda3,再实现切换Python自由。目录安装Anaconda配置虚拟环境基于 python3.6 创建一个名为py3_shaopf 的环境激活 py2 环境切换到python3安装Anaconda官方下载地址:https://www.anaconda.com/download/可以通过内置的Firefox浏览器对其进行下载,注意下载对应的Linux版原创 2022-03-12 11:35:33 · 5443 阅读 · 1 评论 -
Praat脚本-030 | 谈谈自动标注这点儿事(3)
目录简介安装环境安装Python安装WxPython安装JuliusSPPAS使用数据格式数据准备准备音频和文本导入SPPAS进行切分关注版权说明简介SPPAS工具是由Brigitte Bigi(Laboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具,目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善,但是对于一般的语音研究者来说,能够自动原创 2021-09-05 12:19:50 · 1349 阅读 · 0 评论 -
Praat脚本-021 | 获取一个目录里的指定的部分文件
今天的文章还是之前打包的一个脚本的解释,这个脚本非常简单,只有几行,功能也很简单,是为了得到一个目录里的所有文件名,这个脚本也可以作为学习如何使用、编写脚本的一个很好的例子。假设我们想知道目录E:\Biaobei_Demo里有多少个wav,并且得到这些文件名,如下:000001.wav000002.wav000003.wav000004.wav000005.wav000006.wav000007.wav000008.wav000009.wav...其实通过简单的Dos命令一句话就可原创 2020-09-23 22:59:43 · 642 阅读 · 0 评论 -
Python | 基本的信息统计-层级之间的信息
本文的脚本还是关于统计,上一次提供了针对某一层的统计信息(Praat脚本 | 基本的信息统计),可以帮助我们了解自己标注的具体情况,可以检查标注的信息是否有错误。本次提供一个Python脚本还是关于统计的,除了单独了解每一层的标注信息,我们有时候还想了解某个字或者词,在我们的音库里标注了几种情况的发音。比如print这个词或者“卡”这个字,我们想了解总共有几种发音形式?有人可能会好奇这么做的意义,因为几乎每个词每个字基本都有固定的发音?!但很多语言的字词都会有复杂的发音体系,也就是发音并不唯一;再者说,你原创 2020-09-21 20:56:38 · 614 阅读 · 0 评论 -
Python | 如何优雅的使用Python读取TextGrid文件
今天的文章跟Praat脚本无关,作为这个所谓的“人工智能”时代最流行的编程语言,如何使用Python处理TextGrid并提取一些数据自然是很有必要的,因为从处理复杂关系的数据来说,Praat脚本的能力还是比较有限的,即使可以完成,也会花费很多精力而使工作效率低下。但是不可否认,Praat脚本对于处理有层级结构的标注文件是有很大优势的。本文作为一个开始,先简单了解用Python读取TextGrid文件,有人可能会说,TextGrid文件也是文本文件,就是相当于使用Python读写文本文件,这不是很简单的事原创 2020-09-16 23:00:55 · 9330 阅读 · 4 评论 -
语音标注自动音段对齐工具SPPAS使用笔记
[更新日期:2019年08月08日 。咨询邮件feipengshao@163.com,请务必附件样例以及有问题脚本,出错提示等,否则不予回复] SPPAS工具是由Brigitte Bigi(Laboratoire Parole et Langage - Aix-en-Provence - France)开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具...原创 2014-01-16 10:42:00 · 27692 阅读 · 48 评论 -
第一个只出现一次的数及统计频次的扩充
最近从一篇博文里看到一个面试题,找出第一个只出现一次的数,觉得挺有意思的,原创 2014-07-09 12:01:17 · 1071 阅读 · 0 评论 -
使用Perl或者Python加载Praat脚本在DOS命令窗口直接执行
通常一个完整的项目过程中,使用了多个Praat脚本,这时候如果频繁通过打开Praat,再原创 2014-07-24 14:56:14 · 2807 阅读 · 0 评论