海思HI35xx语音识别方案

最新推荐文章于 2024-08-02 09:55:51 发布

dosthing

最新推荐文章于 2024-08-02 09:55:51 发布

阅读量1.2w

点赞数 2

分类专栏：海思HI35xx平台软件开发快速入门系列文章标签：语音识别 Hi35xx 5G 语音合成海思、科大讯飞、百度AI

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dosthing/article/details/86653199

版权

本文介绍了海思HI35xx在语音识别中的应用，包括音频模块知识、语音识别方案和案例。海思音频模块支持声音采集、播放和编解码，常用16kHz采样率。推荐采用云识别方案，如科大讯飞和百度AI，结合5G网络，实现高准确率和低延迟的语音交互。文中还分享了百度AI语音识别的C++案例，涉及curl、openssl和jsoncpp等技术。

摘要由CSDN通过智能技术生成

前言

语音识别是智能化应用的一个重要分支，也是语音交互功能的基础。语音识别基于神经网络算法，借助大数据进行模型训练，据科大讯飞相关数据报道，它们已经能够实现98%以上的准确识别率，同时支持多种外语及国内的一些方言。从语音技术实现方式分类可以分为本地识别和云识别，本地识别主要是借助语音芯片诸如LD3320等，而云识别目前国内比较火的有科大讯飞、百度AI等云服务提供，它们提供友好的API接口，支持多种开发语言，相比于本地语音识别，它的识别准确率更高，应用场景更为灵活。

海思HI35xx音频知识

海思音频模块包含音频输入（AI）、音频输出（AO）、音频编码（AENC）、音频解码（ADEC）这四个模块，这几个模块实现了声音采集、声音播放以及声音编解码的功能。原始的音频信号是模拟信号，通过pcm方式进行数字化，常用音频采样频率有8khz、16khz、32khz、48khz。根据香农采样定理，为了不失真地恢复模拟信号，采样频率应该不小于模拟信号频谱中最高频率的2倍，而人能听到的声音频率范围在20~20000hz，而且听力敏感区是集中在中频区段，所以用

最低0.47元/天解锁文章

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

dosthing CSDN认证博客专家 CSDN认证企业博客

码龄6年

74: 原创

3万+: 周排名

183万+: 总排名

76万+: 访问

: 等级

5722: 积分

323: 粉丝

366: 获赞

120: 评论

1581: 收藏

私信

关注

分类专栏

最新评论

centos一键安装nginx
你看我圆嘛: 我去啥时候成vip文章了
ffplay播放rtsp网络串流失败问题
lmw0320: 我是这么播放的，ffplay rtsp://192.168.49.113:8554/test，不报错，却死活显示不出画面，是怎么回事ine？？ [code=python] libavutil 57. 17.100 / 57. 17.100 libavcodec 59. 18.100 / 59. 18.100 libavformat 59. 16.100 / 59. 16.100 libavdevice 59. 4.100 / 59. 4.100 libavfilter 8. 24.100 / 8. 24.100 libswscale 6. 4.100 / 6. 4.100 libswresample 4. 3.100 / 4. 3.100 libpostproc 56. 3.100 / 56. 3.100 nan : 0.000 fd= 0 aq= 0KB vq= 0KB sq= 0B f=0/0 [/code]
ffplay播放rtsp网络串流失败问题
cecoshi: 以大华摄像头为例, ffplay rtsp://[username]:[password]@[ip]:[port], 就可以播放了.输入后面的path反而无法播放
RTSP协议之TCP/UDP问题
lmw0320: gstreamer的命令是：appsrc ! video/x-raw, format=BGR ! queue ! videoconvert ! video/x-raw,width=1920,height=1080 ! queue ! x264enc ! queue ! video/x-h264, stream-format=byte-stream ! h264parse ! rtph264pay pt=96 config-interval=1 ! udpsink host=127.0.0.1 port=5400 我不是很明白几点： 1. 对于不同视频流的输入，我推送到udp上，是否也要推送到不同的udp端口去？这样rtsp获取的时候，也根据不同的端口来获取不同的流？只要设置factory的不同名称（对rtsp的端口只要一个就可以，而通过不同的factory名称来区别不同的流？？） 2. 这么一长串的命令，实在看得云里雾里的，完全不知道具体的流是如何转换的，是否有必要用这么长的命令来实现？
RTSP协议之TCP/UDP问题
lmw0320: 请教下，我目前的需求是想将边缘设备上的获取到多个摄像头的帧数据，进行处理后，转成RTSP流的方式推送出去，要怎么做才是合适的呢？之前的方案是将图片数据推送到udp服务中，然后起个rtsp的服务，从udp中取流，再推送。看博文的意思，其实用tcp可能更好？对这块完全不了解，求指点。。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。