Qt中使用百度语音API将语音转化为文字

最新推荐文章于 2022-12-10 10:29:13 发布

双丨木

最新推荐文章于 2022-12-10 10:29:13 发布

阅读量2.5k

点赞数 5

分类专栏：嵌入式智能家居

本文链接：https://blog.csdn.net/weixin_44217658/article/details/90607585

版权

嵌入式智能家居专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在Qt中使用百度语音API将语音转化为文字

最近学校实训要做一个嵌入式智能家居项目，我们小组中，我负责语音模块。老师说使用百度API来实现语音，然后通过图灵机器人实现智能对话（具体在后面一篇），我在网上参考了许多代码，很多都是给出一部分代码，而另一部分需要付费。这里将我的成功案例分享出来仅供参考，初次尝试，各位大神勿喷,谢谢！

widget.cpp代码

#include "widget.h"
#include "ui_widget.h"
#include <QJsonDocument>
#include <QJsonParseError>
#include <QDebug>
#include <QFileInfo>
#include <QFile>
#include <QMessageBox>
#include <QScriptEngine>
#include <QScriptValue>
#include <QScriptValueIterator>
#include <QJsonDocument>
#include <QJsonParseError>
#include <QJsonObject>
#include <QJsonArray>


Widget::Widget(QWidget *parent) :
    QWidget(parent),
    ui(new Ui::Widget)
{
     ui->setupUi(this);
	 flag=1;//判断标志,第一次http回应获得 API_access_token 值,后面的http回应才是语音识别的返回结果
     API_id = "自己申请百度语音的API_id";
     API_key = "自己申请百度语音的API_key";
     API_access_token="";
     API_language="zh";
     API_record_path="录音文件的路径";
     manager = new QNetworkAccessManager(this);
     connect(manager,SIGNAL(finished(QNetworkReply*)),this,SLOT(replyFinish(QNetworkReply*)));
     /*发送http请求,目的是得到 API_access_token口令*/
     manager->get(QNetworkRequest(QUrl( "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + API_key + "&client_secret=" + API_secret_key)));
}

Widget::~Widget()
{
    delete ui;
}

void Widget::replyFinish(QNetworkReply * reply)
{
    if(flag==1)
    {
            QString strJsonAccess=reply->readAll();//得到http返回的API_access_token口令
            if(strJsonAccess==NULL)
            {
                ui->textEdit->append("错误！没有得到Json包");
            }
            //对百度语音返回信息(JSON包)进行解析
            QScriptValue jsonAccess;
            QScriptEngine engineAccess;
            jsonAccess = engineAccess.evaluate("value = " + strJsonAccess);
            QScriptValueIterator iteratorAccess(jsonAccess);
            while (iteratorAccess.hasNext())
            {
                  iteratorAccess.next();
                  if(iteratorAccess.name()=="access_token")
				  {
                      API_access_token = iteratorAccess.value().toString();//得到 API_access_token
				  }
             }
            if(API_access_token=="")
            {
                ui->textEdit->append("access_token口令获取失败！");
                return;
            }
            flag=0;
            reply->deleteLater();
    }
    else
    {
         //解析JSON
         QByteArray allData = reply->readAll();
         QJsonParseError json_error;
         QJsonDocument jsonDoc(QJsonDocument::fromJson(allData, &json_error));
         if(json_error.error != QJsonParseError::NoError)
         {
            qDebug() << "BaiDu json error!";
            return;
         }
            QJsonObject rootObj = jsonDoc.object();
			//获取键值，用于查看返回到所有键（可以注释掉）
            QStringList keys = rootObj.keys();
            for(int i = 0; i < keys.size(); i++)
            {
                qDebug() << "key" << i << " is:" << keys.at(i);
            }
			//获取转化回来的文本内容
            if(rootObj.contains("err_no"))
            {
                if(0==rootObj.take("err_no").toVariant().toString())
                {
                      ui->textEdit->append("语音识别错误!");
                }
                else
                      {
                            QJsonArray subArray = rootObj.value("result").toArray();
                            for(int i = 0; i< subArray.size(); i++)
                            {
                                str = subArray.at(i).toString();
                                ui->textEdit->append(str);
                            }

                     }
          }
    }
}


void Widget::getText(QString para_API_id, QString para_API_access_token, QString para_API_language, QString para_API_record_path)
{
    QFile file(para_API_record_path);
    if( !(file.open(QIODevice::ReadOnly)))
    {
        ui->textEdit->append("打开语音文件失败！");
        return;
    }
    /*读入文件流*/
    QDataStream in(&file);
    m_buf =new char[file.size()];
    in.readRawData(m_buf,file.size());
    file.close();

    /*发送http请求给百度语音,从而得到语音文本*/
    QString  getTextUrl = "http://vop.baidu.com/server_api?lan=" + para_API_language + "&cuid=" + para_API_id + "&token=" + para_API_access_token;
    QUrl url;
    url.setUrl(getTextUrl);
    QNetworkRequest request(url);
	//采用wav格式语音，
    request.setHeader(QNetworkRequest::ContentTypeHeader, "audio/wav;rate=16000");
    QByteArray arr = QByteArray(m_buf, file.size());
    manager->post(request,arr);
}

void Widget::on_pushButton_clicked()
{
    getText(API_id,API_access_token,API_language,API_record_path);
}

yuyin1.pro代码

QT       += core gui network script multimedia

greaterThan(QT_MAJOR_VERSION, 4): QT += widgets

TARGET = yuyin
TEMPLATE = app

DEFINES += QT DEPRECATED_WARNINGS

SOURCES += main.cpp\
        widget.cpp

HEADERS  += widget.h

FORMS    += widget.ui

widget.h代码

#ifndef WIDGET_H
#define WIDGET_H
#include <QWidget>
#include <QtNetwork>
#include <QDebug>

namespace Ui {
class Widget;
}

class Widget : public QWidget
{
    Q_OBJECT

public:
    explicit Widget(QWidget *parent = 0);
    void getText(QString para_API_id,QString para_API_access_token,QString para_API_language,QString para_API_record_path);
    ~Widget();
    

private slots:
	//槽函数的定义
    void replyFinish(QNetworkReply *);

    void on_pushButton_clicked();

 //   void myconnected();

 //   void on_bconnect_clicked();

private:
    Ui::Widget *ui;
	//相关变量的定义
    QNetworkAccessManager *manager;
    QNetworkRequest *req;
    QString API_access_token;
    QString API_id;
    QString API_key;
    QString API_secret_key;
    QString API_record_path;
    QString API_language;
    char * m_buf;
    int flag;

//    QTcpSocket tcpSocket;
};

#endif // WIDGET_H

main.cpp代码（没有改动可不看）

#include "widget.h"
#include <QApplication>

int main(int argc, char *argv[])
{
    QApplication a(argc, argv);
    Widget w;
    w.show();
    return a.exec();
}