Qt中使用百度语音API将语音转化为文字


最近学校实训要做一个嵌入式智能家居项目,我们小组中,我负责语音模块。老师说使用百度API来实现语音,然后通过图灵机器人实现智能对话(具体在后面一篇),我在网上参考了许多代码,很多都是给出一部分代码,而另一部分需要付费。这里将我的成功案例分享出来仅供参考,初次尝试,各位大神勿喷,谢谢!

widget.cpp代码

#include "widget.h"
#include "ui_widget.h"
#include <QJsonDocument>
#include <QJsonParseError>
#include <QDebug>
#include <QFileInfo>
#include <QFile>
#include <QMessageBox>
#include <QScriptEngine>
#include <QScriptValue>
#include <QScriptValueIterator>
#include <QJsonDocument>
#include <QJsonParseError>
#include <QJsonObject>
#include <QJsonArray>


Widget::Widget(QWidget *parent) :
    QWidget(parent),
    ui(new Ui::Widget)
{
     ui->setupUi(this);
	 flag=1;//判断标志,第一次http回应获得 API_access_token 值,后面的http回应才是语音识别的返回结果
     API_id = "自己申请百度语音的API_id";
     API_key = "自己申请百度语音的API_key";
     API_access_token="";
     API_language="zh";
     API_record_path="录音文件的路径";
     manager = new QNetworkAccessManager(this);
     connect(manager,SIGNAL(finished(QNetworkReply*)),this,SLOT(replyFinish(QNetworkReply*)));
     /*发送http请求,目的是得到 API_access_token口令*/
     manager->get(QNetworkRequest(QUrl( "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + API_key + "&client_secret=" + API_secret_key)));
}

Widget::~Widget()
{
    delete ui;
}

void Widget::replyFinish(QNetworkReply * reply)
{
    if(flag==1)
    {
            QString strJsonAccess=reply->readAll();//得到http返回的API_access_token口令
            if(strJsonAccess==NULL)
            {
                ui->textEdit->append("错误!没有得到Json包");
            }
            //对百度语音返回信息(JSON包)进行解析
            QScriptValue jsonAccess;
            QScriptEngine engineAccess;
            jsonAccess = engineAccess.evaluate("value = " + strJsonAccess);
            QScriptValueIterator iteratorAccess(jsonAccess);
            while (iteratorAccess.hasNext())
            {
                  iteratorAccess.next();
                  if(iteratorAccess.name()=="access_token")
				  {
                      API_access_token = iteratorAccess.value().toString();//得到 API_access_token
				  }
             }
            if(API_access_token=="")
            {
                ui->textEdit->append("access_token口令获取失败!");
                return;
            }
            flag=0;
            reply->deleteLater();
    }
    else
    {
         //解析JSON
         QByteArray allData = reply->readAll();
         QJsonParseError json_error;
         QJsonDocument jsonDoc(QJsonDocument::fromJson(allData, &json_error));
         if(json_error.error != QJsonParseError::NoError)
         {
            qDebug() << "BaiDu json error!";
            return;
         }
            QJsonObject rootObj = jsonDoc.object();
			//获取键值,用于查看返回到所有键(可以注释掉)
            QStringList keys = rootObj.keys();
            for(int i = 0; i < keys.size(); i++)
            {
                qDebug() << "key" << i << " is:" << keys.at(i);
            }
			//获取转化回来的文本内容
            if(rootObj.contains("err_no"))
            {
                if(0==rootObj.take("err_no").toVariant().toString())
                {
                      ui->textEdit->append("语音识别错误!");
                }
                else
                      {
                            QJsonArray subArray = rootObj.value("result").toArray();
                            for(int i = 0; i< subArray.size(); i++)
                            {
                                str = subArray.at(i).toString();
                                ui->textEdit->append(str);
                            }

                     }
          }
    }
}


void Widget::getText(QString para_API_id, QString para_API_access_token, QString para_API_language, QString para_API_record_path)
{
    QFile file(para_API_record_path);
    if( !(file.open(QIODevice::ReadOnly)))
    {
        ui->textEdit->append("打开语音文件失败!");
        return;
    }
    /*读入文件流*/
    QDataStream in(&file);
    m_buf =new char[file.size()];
    in.readRawData(m_buf,file.size());
    file.close();

    /*发送http请求给百度语音,从而得到语音文本*/
    QString  getTextUrl = "http://vop.baidu.com/server_api?lan=" + para_API_language + "&cuid=" + para_API_id + "&token=" + para_API_access_token;
    QUrl url;
    url.setUrl(getTextUrl);
    QNetworkRequest request(url);
	//采用wav格式语音,
    request.setHeader(QNetworkRequest::ContentTypeHeader, "audio/wav;rate=16000");
    QByteArray arr = QByteArray(m_buf, file.size());
    manager->post(request,arr);
}

void Widget::on_pushButton_clicked()
{
    getText(API_id,API_access_token,API_language,API_record_path);
}

yuyin1.pro代码

QT       += core gui network script multimedia

greaterThan(QT_MAJOR_VERSION, 4): QT += widgets

TARGET = yuyin
TEMPLATE = app

DEFINES += QT DEPRECATED_WARNINGS

SOURCES += main.cpp\
        widget.cpp

HEADERS  += widget.h

FORMS    += widget.ui

widget.h代码

#ifndef WIDGET_H
#define WIDGET_H
#include <QWidget>
#include <QtNetwork>
#include <QDebug>

namespace Ui {
class Widget;
}

class Widget : public QWidget
{
    Q_OBJECT

public:
    explicit Widget(QWidget *parent = 0);
    void getText(QString para_API_id,QString para_API_access_token,QString para_API_language,QString para_API_record_path);
    ~Widget();
    

private slots:
	//槽函数的定义
    void replyFinish(QNetworkReply *);

    void on_pushButton_clicked();

 //   void myconnected();

 //   void on_bconnect_clicked();

private:
    Ui::Widget *ui;
	//相关变量的定义
    QNetworkAccessManager *manager;
    QNetworkRequest *req;
    QString API_access_token;
    QString API_id;
    QString API_key;
    QString API_secret_key;
    QString API_record_path;
    QString API_language;
    char * m_buf;
    int flag;

//    QTcpSocket tcpSocket;
};

#endif // WIDGET_H

main.cpp代码(没有改动可不看)

#include "widget.h"
#include <QApplication>

int main(int argc, char *argv[])
{
    QApplication a(argc, argv);
    Widget w;
    w.show();
    return a.exec();
}
  • 5
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
### 回答1: 在Qt,QJsonObject是一种用于处理JSON数据的类。结合Qt5、百度语音API和图灵机器人API,我们可以创建一个智能语音聊天机器人。 首先,我们需要使用Qt5的功能来录制和播放音频。通过QAudioFormat类和QAudioInput和QAudioOutput类,我们可以实现音频的录制和播放功能。在录制音频之后,我们可以将它发送到百度语音API进行语音识别。 百度语音API提供了语音识别的功能,它接受音频数据并将其换为文本。我们可以使用Qt的网络功能发送音频数据到百度的服务器,并接收返回的识别结果。QNetworkAccessManager类和QNetworkRequest类可以用于发送和接收网络请求。 接下来,我们可以使用图灵机器人API实现对话的功能。图灵机器人API能够处理人类语言,并提供回答、解析意图等功能。我们可以使用Qt的网络功能发送用户输入的文本到图灵机器人的服务器,并获取机器人的回复。同样地,我们可以使用QNetworkAccessManager类和QNetworkRequest类来进行网络请求。 最后,我们可以将图灵机器人的回答换为语音,然后用QAudioOutput类将其播放出来。这样用户就能听到机器人的回复了。 总结来说,基于Qt5、百度语音API和图灵机器人API,我们可以创建一个智能语音聊天机器人。通过Qt的音频录制和播放功能以及网络功能,我们能够将用户的语音输入发送到百度语音API进行语音识别,并将识别结果发送到图灵机器人API进行对话处理。最后,将机器人的回答换为语音并播放给用户。 ### 回答2: 在Qt使用QJsonObject类可以基于Qt5,通过集成百度语音API和图灵机器人API实现智能语音聊天机器人。 首先,我们需要使用Qt的网络模块与百度语音API进行交互。通过构建HTTP请求,在发送请求时传入音频数据,将其发送给百度语音API进行语音识别。返回的结果可以使用QJsonObject类进行解析和处理。可以获取识别出的文本,并将其传递给图灵机器人API进行下一步处理。 其次,通过Qt的网络模块,通过HTTP请求与图灵机器人API进行交互,将百度语音识别出的文本发送给图灵机器人API,获取其回复的文本信息。同样,可以使用QJsonObject类对返回的数据进行解析和处理。 最后,将图灵机器人API返回的回复文本再次发送给百度语音API进行语音合成。通过QJsonObject类解析返回的音频数据,将其播放出来,用户可以听到机器人的回复。 通过使用QJsonObject类,我们可以方便地对百度语音API和图灵机器人API返回的JSON数据进行解析和处理,并根据需要进行相应的操作和回应。这样,就可以实现一个基于Qt5的智能语音聊天机器人。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值