linux系统（ubuntu）调用科大讯飞SDK实现语音识别及语音合成

最新推荐文章于 2024-01-27 14:14:12 发布

李纳克斯

最新推荐文章于 2024-01-27 14:14:12 发布

阅读量8.8k

点赞数 10

文章标签：语音识别语音合成科大讯飞

本文链接：https://blog.csdn.net/qq_38639426/article/details/103409845

版权

1.语音识别

登录科大讯飞官网，注册账号后转到“语音识别”栏目，下载SDK，如图：

我选择了语音听写和语音合成，都是在线的。选好后生成SDK，下载到本地，然后在linux系统中解压，并进入sample目录的iat_online_record_sample目录下。

执行 source 64bit_make.sh

此时会提示“alsa/asound.h:没有那个文件或目录”。解决办法：

sudo apt-get install libasound2-dev

然后就可以去../../bin目录下执行对应的可执行文件了。

ubutnu18的检查麦克风是否可用的设置在这里：

可以通过说话检测input level是否会随之变化。

2.语音合成

进入到sample目录的tts_online_sample目录下。

执行 source 64bit_make.sh

然后就可以去../../bin目录下执行对应的可执行文件了。

它会根据源码中预设的文本合成语音，并生成wav文件在bin目录下。播放wav文件的方法是

安装
sudo apt-get install sox
sudo apt-get install libsox-fmt-all
然后在C代码中写上
{
    system("play tts_sample.wav");
}
就可以播放了。

于是我通过改这两个文件，合成了一个语音识别后将文字再合成语音播放出来，由于Makefile基本是相同的，因此将各自的main函数合到一起就可以了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

李纳克斯

关注关注

10
点赞
踩
77

收藏

觉得还不错? 一键收藏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

清洁机器人之语音方案之二.语音资源文件wav生成

aiot_bigbear的专栏,关注我获取最新技术文章信息与海量资源~

05-25

286

二.语音资源文件wav生成文章目录二.语音资源文件wav生成1.定义语音资源数组2.循环调用生成语音API3.执行，具体结果如下3.1配置so路径 科大讯飞的开放平台 https://www.xfyun.cn/doc/ 首先注册科大讯飞账号及应用，以后每个下载的在线使用SDK都是以此账户ID登录讯飞语音服务器。 sdk集成指南： https://www.xfyun.cn/doc/tts/offline_tts/Linux-SDK.html#_2%E3%80%81sdk%E9%9B%86%E6%88%90%

【Ubuntu】科大讯飞语音（一）

rating_的博客

05-24

2095

一、语音识别环境： gec6818目录：实现语音控制的一个目录这个程序用到了：viocectl.c common.c libxml2.so 但是我们没有libxml2.so这个库在线下载：(下载的文件会放在/usr/lib/x86_64-linux-gnu这个文件夹下) sudo apt-get install libxml2-dev 在终端打开code/gec6818这个文件夹执行以下命令 gcc voicectl.c common.c -o voicectl -I./inc -L /

9 条评论您还未登录，请先登录后发表或查看评论

linux 基于科大讯飞的文字转语音使用

热门推荐

littlethunder的专栏

11-30

3万+

我之前发过我的贪吃蛇的代码，我想把它变成语音控制上下左右的，于是选择科大讯飞的SDK，官方有一些文档，但有一些细节还是会让在linux下开发的孩子们产生困惑比如我，现在总结在此~ 首先下载科大讯飞的SDK-linux版本，需要注册先。。。在下载下来的include文件夹下，有四个文件：msp_errors.h msp_types.h qisr.h qtts.h。前两个是通用

linux 下 QT 讯飞语音合成

欧阳的博客

07-27

2万+

1. 下载讯飞基于Linux的语音文档Linux_tts_online demo链接里面的目录如下: bin: 一些用来测试的文件 doc：技术文档 include：将使用的头文件 lib：qt编译需要加入的库文件 samples：使用demo 2. 新建widgt窗体项目，这里我的项目名是TTLSpeech_Demo,右击项目名，选择add Library-&amp;gt;Browse加入l...

科大讯飞 离线语音识别python_ubuntu16.04安装科大讯飞Linux SDK实现离线语音合成(TTS) - pytorch中文网...

weixin_39769406的博客

12-03

1505

一、新建工程文件夹在当前目录建立一个新目录demo:$ mkdir demo然后前往科大讯飞SDK下载SDK。二、配置工程属性将SDK中bin,include,libs文件夹复制到新建工程demo文件夹下在demo目录新建文件demo.c，详细源码请参考samples中对应的语音示例,修改一下文件路径如下：#include #include #include #include #include ...

基于ROS调用科大迅飞进行语音合成

03-12

要实现基于ROS调用科大讯飞进行语音合成，开发者需要在Linux环境下，特别是Ubuntu发行版本中进行。Linux操作系统因其开源、稳定等特性，广泛被应用于机器人操作系统中。开发过程还需要参考ROS小课堂中的知识，这可能...

Linux下科大讯飞语音识别全面总结

q6q6q的专栏

10-27

3193

原标题：Linux下科大讯飞语音识别全面总结首先我们需要的就是Linux下的SDK的下载包，首先在科大讯飞的官网http://www.xfyun.cn/注册，选择我们的语音识别的功能相应的Linux SDK下载，对应的生成Linux_iat1166_tts_online1166_5ad417ef.zip 的压缩包，然后解压缩如下： bin目录下面是我们的生成的可执行的文件;doc目录是我们的api...

Linux下讯飞语音配置入门

yuelengloulan的专栏

06-01

1万+

本来是想在树莓派3上做开发的，可是没有树莓派3的SDK，在这里先在Linux上熟悉下讯飞语音。 Linux系统：Ubuntu16 64位一、注册获取SDK在讯飞开发者平台进行注册，注册分个人用户和企业用户，个人用户注册提供用户名和姓名，需要绑定手机号，企业用户除了需要以上信息外还需要纳税登记号和营业执照等资质信息。注册好后在开发者平台首页下，按照新手接入流程进行操作就好了。获取SD

linux中文语音合成软件,分享|eSpeak: Linux 文本转语音工具

weixin_39596668的博客

05-04

1654

eSpeak是一款 Linux 命令行工具，能把文本转换成语音。它是一款简洁的语音合成器，用C语言编写而成，它支持英语和其它多种语言。eSpeak 从标准输入或者输入文件中读取文本。虽然语音输出与真人声音相去甚远，但是，在你项目需要的时候，eSpeak 仍不失为一个简便快捷的工具。eSpeak 部分主要特性如下：提供给 Linux 和 Windows 的命令行工具从文件或者标准输入中把文本读出来提...

科大讯飞 语音识别报引擎内部错误错误代码 20021

无需有太多~

01-09

7379

原因：出现20021错误，一般是找不到下面四个文件解决方案：将这几个文件放入系统中指定的文件夹内！ Linux：将他们放入自己的项目的lib文件夹下 Window：丢入 C:\Windows\System32 文件夹下官方的帖子： http://bbs.xfyun.cn/forum.php?mod=viewthread&tid=9864 ...

ubuntu16.04+ROS+科大讯飞+图灵AI机器人（一）

weixin_41772246的博客

07-11

1521

首先登录科大讯飞官网，注册自己的appid（这个id很有用，以后你的代码中的appid都要改成这个）第一步先确保你的音频设备可以正常录音和放音（推荐audacity软件进行调试，如果没安装 sudo apt-get install audacity) 第二步去科大讯飞官网下载SDK 点控制台，将自己想要的功能选中，下载下来，解压到与catkin_ws并列的目录下，改名为...

ubuntu64位（x86）下科大讯飞sdk使用注意事项

微电子学与固体电子学-俞驰

11-13

4722

appleyuchi@Ubuntu16:~/demo$ gcc demo.c /tmp/cc1yENlA.o：在函数‘get_grammar_id’中： demo.c:(.text+0x146)：对‘MSPUploadData’未定义的引用 /tmp/cc1yENlA.o：在函数‘run_asr’中： demo.c:(.text+0x42b)：对‘QISRSessionBegin’未定义的

ubuntu 麦克风录音_如何在Ubuntu中测试麦克风

weixin_33476081的博客

01-14

3622

如果您使用的是系统的内置麦克风或外接麦克风，请务必测试您的声音是否通过系统。仅当系统正在读取麦克风声音作为输入时，它才能进一步处理它并在任何应用程序中使用它。在本文中，我们将介绍如何在Ubuntu上测试麦克风。我们还将说明如何对麦克风设置进行配置，以确保其以最佳方式工作。我们已经在Ubuntu 18.04 LTS系统上运行了本文中提到的命令和过程。在Ubuntu上测试麦克风的步骤如果您更喜欢使用G...

接口调用-【4】讯飞离线语音合成Windows/Linux

p6448777的博客

06-29

1922

1、离线语音合成调用主函数（离线语音合成调用属于简单的，无回调函数） package com.iflytek; import com.iflytek.util.Step2_tts_thread; import com.iflytek.util.Step3_audioFormat; import java.util.Scanner; import javax.sound.sampled.*; /** * 请注意！！！ * 1.首选到控制台https://console.xfyun.cn/servic

科大讯飞语音合成

奋斗的日子最甜美，在科技的海洋里，永无止境。

03-14

1484

一、写在前面的话讯飞为我们提供了一个很好地平台，语音的相关技术是人工智能的一项重要组成部分。了解与掌握语音的合成技术更是掌握了一项技能，当然本文就是从浅层入手，了解使用讯飞语音平台提供的API 的使用；能够通过一些简单的配置来使用该项技术。不管怎样多学点儿总归是好的。如果你还不会在讯飞语音平台创建应用，请先了解讯飞语音的详细配置使用二、功能描

【语音识别学习】Linux下用Python实现科大讯飞语音识别和语音合成接口调用(github源码)

Johnson的博客

03-23

4380

最近要跟着导师做一个语音识别的工程项目，由于在前期只需要快速的建立软件架构，所以选择使用科大讯飞提供的云接口进行快速开发，但科大讯飞在Linux的sdk中只提供了c++的实现，为了今后的开发方便，我将其进行了Python封装，也把源码分享在这里，为大家提供方便。一、概述虽然在我的github源码中已经写了README，...

Linux语音播放

持之以恒2016

01-15

894

工具安装软件 $ sudo apt-get install sox 安装语音库 $ sudo apt-get install sox libsox-fmt-all 常用命令播放 $ play xxx.mp3 xxx.mp3: File Size: 140k Bit Rate: 128k Encoding: MPEG audio Channels: 2 @ 16-bit Samplerate: 44100Hz Replaygain: off

ubuntu 科大讯飞语音合成

08-16

在Ubuntu系统上使用科大讯飞语音合成，你可以按照以下步骤进行操作： 1. 首先，你需要前往科大讯飞的官方网站注册账号并申请使用语音合成API。获取到API Key和API Secret后，记下来备用。 2. 下载并安装Python SDK。你可以在科大讯飞的官方网站上找到适用于Ubuntu系统的SDK，下载并解压缩到本地。 3. 安装Python依赖库。打开终端，使用以下命令安装所需的依赖库： ``` pip install pyaudio pip install requests pip install hashlib ``` 4. 在你的Python项目中引入SDK。将解压缩后的SDK文件夹拷贝到你的项目目录下，并在需要使用语音合成的代码文件中引入SDK： ```python from xunfei import XunfeiSpeech ``` 5. 创建XunfeiSpeech实例。在代码中，创建一个XunfeiSpeech实例，并使用你在第一步中获取到的API Key和API Secret进行初始化： ```python app_id = 'your_app_id' api_key = 'your_api_key' api_secret = 'your_api_secret' xunfei_speech = XunfeiSpeech(app_id, api_key, api_secret) ``` 6. 调用语音合成接口。使用以下代码调用语音合成接口，将文字转换为语音： ```python text = '要转换为语音的文本' speech = xunfei_speech.tts(text) ``` 7. 播放语音。你可以使用Python的音频播放库（如pyaudio）来