语音产品
道法—自然
不积跬步,无以至千里;不积小流,无以成江海。——荀子
展开
-
语音合成中的特殊读法
特殊读法:1、演示涉及语音识别出现白字的问题2、演示需要的意图配置“发现东大I路”,在播报的时候念得是i不是I,需要优先处理将“发现东大I路”错播成了“发现东大爱路”将“#1”跳过了“#”,将“1”错误念成了“yao”,而“#1”应该念成“1号”相应地:“#0——#9”号相应地应该念成“0号”、“1号”。。9号需要单独列出来的:scada si(斯) ga(嘎) da(搭) oms ou(欧) mi(米) si(斯)oms念成“O”、“M”、“S”也可以如果是物理值,需要念成100为.原创 2020-07-02 15:45:39 · 445 阅读 · 0 评论 -
语音播报中的特殊处理
语音播报参观讲解1、语音播报中途停止(打断)2、语音播报柔和,有感情,具体解决办法:①标点符号停顿(,。:!;?、)②调整语速(提供接口,底层有默认的值,可以修改)③语音播报增加声调调(评估、尽量能实现)3、特殊读法的处理①特殊读法:kV(必须是:k小写,V大写,读千伏)②相(四声):在和A,B,C一起出现时,三相、单相、两相、相电流、相电压、相间电流(电力系统语境)、相间电压(电力系统语境下)读 四声;③小数点(.),当前后全部为数字的时候,读成dian(1.57),当前后是汉字的时候.原创 2020-07-02 15:42:22 · 454 阅读 · 0 评论 -
云计算芯片、GPU、CPU
原创 2020-06-02 21:31:17 · 835 阅读 · 0 评论 -
参观场景下语音播报的特殊处理
语音播报参观讲解1、语音播报中途停止(打断)2、语音播报柔和,有感情,具体解决办法:①标点符号停顿(,。:!;?、)②调整语速(提供接口,底层有默认的值,可以修改)③语音播报增加声调调(评估、尽量能实现)3、特殊读法的处理①特殊读法:kV(必须是:k小写,V大写,读千伏)②相(四声):在和A,B,C一起出现时,三相、单相、两相、相电流、相电压、相间电流(电力系统语境)、相间电压(电力系统语境下)读 四声;③小数点(.),当前后全部为数字的时候,读成dian(1.57),当原创 2020-05-31 15:33:31 · 246 阅读 · 0 评论 -
搜狗语音识别支持的服务
原创 2020-05-28 16:53:04 · 481 阅读 · 0 评论 -
语音唤醒的例子
小米音响:小爱同学;百度音响:小度小度;google:OK google;苹果手机:hi Siri;微软:微软小斌微软:微软小娜;天猫:天猫精灵;叮咚音箱;小雅同学;出门问问;原创 2020-05-24 20:59:55 · 882 阅读 · 0 评论 -
为什么既懂技术又懂管理的项目经理更有发展
为什么既懂技术又懂管理的项目经理更有发展项目背景2019年11月,我公司中标了石化XX公司的智能语音项目,我被任命为该项目的项目经理,全程负责该项目的建设工作。该项目投资120万元,从2019年11月25号开始,预计建设周期4个月。该项目包括语音识别、语音合成、声纹识别等功能模块。语音识别中又包括实施流式语音识别、上传文件的语音识别、点击开始结束的语音识别,及石化领域语音识别、通用领域语音识别、英文识别,还有将指令转换成命令套接字、语音唤醒等功能。声纹识别中包括音频录制、声纹注册、声纹识别、声纹原创 2020-05-12 22:40:27 · 407 阅读 · 0 评论 -
SH语音项目管理心得
做项目管理,目的只有一个,那就是项目的交付,过程其实并不是太重要。项目经理在做项目过程中,重点是要沟通,一帆风顺的项目基本上是没有的。做项目,核心是要搞定用户,建立用户之间的信任;方式方法有:满足用户的需求,对于用户需求的及时响应,按照用户说的要求去办事情;当然有一些团队驻场开发,驻场住宿就选择用户所在的小区,和用户同吃同住等,最终得到用户的确认。项目经理在选择做项目,要选择组织架构健全的单位,每一层级的对接要清楚明确,要有商务经理、技术经理、开发人员等;确保要有人员组织,遇到问题要有人大家一起原创 2020-05-12 22:25:18 · 629 阅读 · 1 评论 -
语音识别适配浏览器厂商比较
浏览器 浏览器内核 讯飞语音 阿里语音 腾讯语音 思必驰语音 Goole 03年前用webkit作为内核;03后使用webkit的分支内核Blink,单内核 √ √ √ √ QQ浏览器 Trident(兼容模式)+Webk...原创 2020-05-11 18:31:04 · 234 阅读 · 0 评论 -
视频中全高清、高清、标清的区别
全高清、高清和标清的区别发布时期:2017-06-05 作者:XUNWEI随着科技的发展,数字电视被越来越多的作为显示设备,数字电视分为高清晰度电视(HDTV)、增强清晰度电视(EDTV)和标准清晰度电视(SDTV)三大类。其中高清晰度数字电视水平分辨率应至少达到720线, 屏幕宽高比应为16:9,这与我国的国家标准草案的要求一致。所谓分辨率指的是,电视机的显示图像由许多像素点构成,屏...原创 2020-05-08 15:14:27 · 3119 阅读 · 0 评论 -
数字证书及公钥、私钥
用户在访问一个网站的时候,用户不知道这个网站是合法网站还是钓鱼网站,但是浏览器会弹出提醒用户,意思就是说有可能是一个钓鱼网站,问主人是否继续访问。如果用户点击“允许”,那么就说明即使访问到了钓鱼网站造成了损失,这个锅是由用户自己承担的。这样即使访问正常的网站,也会一直提醒,好麻烦呀。有没有解决办法呢,答案是有的。当用户访问的时候,这个服务器底层完成给浏览器显示自己合法的证明材料,这个证明材料即...原创 2020-04-29 16:30:22 · 3856 阅读 · 1 评论 -
数字证书和域名的对应关系
通常情况下,证书和域名关系是一对一的关系,证书和服务器也是一对一的关系。本文所讨论的则是不通常的情况。证书颁发机构一般给证书分成三类,DV证书,OV证书以及EV证书。DV证书就是通常意义上给网站颁发的证书,审核不是很严格,一般免费居多。其在证书的使用者字段中一般没有O=这个字段或者O=对应的网站名称。OV证书一般收费,因为要给申请的企业做审核,这样会在证书的使用者字段中填写O = ...原创 2020-04-29 12:52:33 · 3213 阅读 · 1 评论 -
数字证书与域名
您好,语音识别服务采用谷歌浏览器端采音,底层调用谷歌浏览器的插件,使用https协议。该协议在使用过程中,每次都会弹出“允许”等验证及校验的环节,用户在使用过程中带来了很大的不方便。解决该问题的方法是想要权威证书颁发权威数字证书及域名,达到内网访问者在访问该服务二级域名的时候,该二级域名能够出示数字证书,底层自动完成验证,解决掉证书授权的问题。因此需要您提供访问使用语语音识别展示版本及知识管理场景...原创 2020-04-28 12:01:53 · 348 阅读 · 0 评论 -
音频PCM的采集和播放
1、音频基础知识声道数(通道数)即声音的通道的数目。很好理解,有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的也处理成两个喇叭输出同一个声道的声音),立体声的PCM可以使两个喇叭都发声(一般左右声道有分工) ,更能感受到空间效果。采样位数即采样值或取样值(就是将采样样本幅度量化)。它是用来衡量声音波动变化的一个参数,也可以说是声卡的分辨率。它的数值越大,分辨率也就越高...原创 2020-04-21 13:52:20 · 3990 阅读 · 0 评论 -
WAV和PCM的关系和区别
1、音频基础知识声道数(通道数)即声音的通道的数目。很好理解,有单声道和立体声之分,单声道的声音只能使用一个喇叭发声(有的也处理成两个喇叭输出同一个声道的声音),立体声的PCM可以使两个喇叭都发声(一般左右声道有分工) ,更能感受到空间效果。2、采样位数即 采样值或取样值(就是将采样样本幅度量化)。它是用来衡量声音波动变化的一个参数,也可以说是声卡的分辨率。它的数值越大,分辨率也就越高,...原创 2020-04-21 13:36:41 · 6670 阅读 · 0 评论 -
语音音频文件识别
在语音音频文件识别中,目前市面长能够支持识别的音频文件格式受几个参数的影响:①音频文件格式:pcm,wav,ogg_speex,ogg_opus,mp3,opus;②采样位宽:16bits;③声道:单声道;④采样率:16k;...原创 2020-04-21 10:17:12 · 3375 阅读 · 0 评论