语音识别
文章平均质量分 93
yuanlulu
做过嵌入式Linux开发、深度学习平台开发。擅长c++和python。
展开
-
汉语语音基本特性
人的发音生理机构如图 2.3.1所示,发音时由肺部收缩送出一股直流空气,经气管流至喉头声门处(声门即声带开口处),在发声之初,声门处的声带肌肉收缩,声带并拢间隙小于 1mm,这股直流空气冲过很小的缝隙,使声带得到横向和纵向的速度,此时,声带向两边运动,缝隙增大(成年男性开到最大时,截面积约为 20mm),声门处压力下降,弹性恢复力将声带拉回平衡位置并继续趋向闭合,即声带产生振动,而且具有一定的振动周期,如图 2.3.2所示。,是一种三维图形,纵轴对应于频率,横轴对应于时间,图像的黑白度正比于语音信号的。原创 2024-04-01 18:14:57 · 1163 阅读 · 0 评论 -
语音识别接口webAPI-python测试:百度和科大讯飞
概述目前市场上有很多家的语音识别接口可用,简单测试都不要钱。国内的BAT和科大讯飞,国外的微软和谷歌都提供了中文的语音识别接口,既有sdk又有webAPI。我的测试都是在python3环境下进行的。最终选择百度和科大讯飞的接口。主要是考虑中文识别应该国内厂商做的更好。免费试用阶段,科大讯飞每天限定500次调用。百度则只限制每秒20次,总次数没限制。试用下来的感觉就是,科大讯飞的接口...原创 2018-08-22 17:24:55 · 35837 阅读 · 15 评论