AndroidStudio集成科大讯飞语音SDK

最新推荐文章于 2023-05-07 16:34:05 发布

倾锋落颖花

最新推荐文章于 2023-05-07 16:34:05 发布

阅读量9.8k

点赞数 1

分类专栏：资源分享文章标签： sdk 科大讯飞

本文链接：https://blog.csdn.net/java04/article/details/51545322

版权

资源分享专栏收录该内容

7 篇文章 0 订阅

订阅专栏

AndroidStudio集成科大讯飞语音SDK

讯飞开放平台作为全球首个开放的智能交互技术服务平台，致力于为开发者打造一站式智能人机交互解决方案。用户可通过互联网、移动互联网，使用任何设备、在任何时间、任何地点，随时随地享受讯飞开放平台提供的“听、说、读、写……”等全方位的人工智能服务。目前，开放平台以“云+端”的形式向开发者提供语音合成、语音识别、语音唤醒、语义理解、人脸识别、个性化彩铃、移动应用分析等多项服务。本篇blog主要记录AS下科大讯飞语音sdk的具体步骤

下载科大讯飞语音sdk

科大讯飞开放平台
在下载SDK之前建议先创建应用，因为应用需要先审核。

科大讯飞语音sdk集成步骤

1、解压缩 Android_voice_xxxx_574cfae8.zip 压缩包

2、建议复制lib下所有.jar或.so文件

3、如果需要讯飞的语音合成UI，复制assets下文件到你当前项目的main目录下

4、配置 AndroidManifest.xml（权限）

    <!--连接网络权限,用于执行云端语音能力 -->
    <uses-permission android:name="android.permission.INTERNET"/> <!--获取手机录音机使用权限,听写、识别、语义理解需要用到此权限 --> <uses-permission android:name="android.permission.RECORD_AUDIO"/> <!--读取网络信息状态 -->
    <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE"/> <!--获取当前wifi状态 -->
    <uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/> <!--允许程序改变网络连接状态 -->
    <uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/> <!--读取手机信息权限 -->
    <uses-permission android:name="android.permission.READ_PHONE_STATE"/> <!--读取联系人权限,上传联系人需要用到此权限 -->
    <uses-permission android:name="android.permission.READ_CONTACTS"/>
    <!--外存储写权限,构建语法需要用到此权限 -->
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/> <!--外存储读权限,构建语法需要用到此权限 -->
    <uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/> <!--配置权限,用来记录应用配置信息 -->
    <uses-permission android:name="android.permission.WRITE_SETTINGS"/>   <!--摄相头权限,拍照需要用到 -->
<uses-permission android:name="android.permission.CAMERA" />

初始化SDK（需要在应用程序启动时调用一次该 API 即可，所以建议写在Application里面）

public class MyApplication extends Application {
    @Override
    public void onCreate() {
        super.onCreate();
        SpeechUtility.createUtility(this, SpeechConstant.APPID + "=你的APPID");
    }
}

以上都配置好了，接下来就是接入使用了

1、简单的集成讯飞语音输入 UI

public void startlis(View view) {
        //1.创建RecognizerDialog对象
        RecognizerDialog mDialog = new RecognizerDialog(this, new InitListener() {
            @Override
            public void onInit(int i) {

            }
        });
        //2.设置accent、language等参数
        mDialog.setParameter(SpeechConstant.LANGUAGE, "zh_cn");
        mDialog.setParameter(SpeechConstant.ACCENT, "mandarin");
        //若要将UI控件用于语义理解,必须添加以下参数设置,设置之后onResult回调返回将是语义理解 //结果
        // mDialog.setParameter("asr_sch", "1");
        // mDialog.setParameter("nlp_version", "2.0");
        //3.设置回调接口
        mDialog.setListener(new RecognizerDialogListener() {
            @Override
            public void onResult(RecognizerResult recognizerResult, boolean b) {
                printResult(recognizerResult);
            }

            @Override
            public void onError(SpeechError speechError) {

            }
        });
        // 4.显示dialog,接收语音输入
        mDialog.show();
    }

获取到返回结果是json格式，解析即可：


/**
     * 解析方法
     * @param results
     */
    private void printResult(RecognizerResult results) {
        JsonParser jsonParser = new JsonParser();
        String text = jsonParser.parseIatResult(results.getResultString());

        String sn = null;
        // 读取json结果中的sn字段
        try {
            JSONObject resultJson = new JSONObject(results.getResultString());
            sn = resultJson.optString("sn");
        } catch (JSONException e) {
            e.printStackTrace();
        }

        mIatResults.put(sn, text);

        StringBuffer resultBuffer = new StringBuffer();
        for (String key : mIatResults.keySet()) {
            resultBuffer.append(mIatResults.get(key));
        }

        mResultText.setText(resultBuffer.toString());
    }

/**
     * Json结果解析类
     */
    class JsonParser {

        String parseIatResult(String json) {
            StringBuffer ret = new StringBuffer();
            try {
                JSONTokener tokener = new JSONTokener(json);
                JSONObject joResult = new JSONObject(tokener);

                JSONArray words = joResult.getJSONArray("ws");
                for (int i = 0; i < words.length(); i++) {
                    // 转写结果词，默认使用第一个结果
                    JSONArray items = words.getJSONObject(i).getJSONArray("cw");
                    JSONObject obj = items.getJSONObject(0);
                    ret.append(obj.getString("w"));
//              如果需要多候选结果，解析数组其他字段
//              for(int j = 0; j < items.length(); j++)
//              {
//                  JSONObject obj = items.getJSONObject(j);
//                  ret.append(obj.getString("w"));
//              }
                }
            } catch (Exception e) {
                e.printStackTrace();
            }
            return ret.toString();
        }
    }

2、集成语音合成功能

public void readnews(View view) {
//1.创建 SpeechSynthesizer 对象, 第二个参数:本地合成时传 InitListener
        SpeechSynthesizer mTts = SpeechSynthesizer.createSynthesizer(MainActivity.this, null);
        //2.合成参数设置,详见《MSC Reference Manual》SpeechSynthesizer 类
        // 设置发音人(更多在线发音人,用户可参见 附录13.2
        mTts.setParameter(SpeechConstant.VOICE_NAME, "xiaoyan");
        //设置发音人
        mTts.setParameter(SpeechConstant.SPEED, "50");
        //设置语速
        mTts.setParameter(SpeechConstant.VOLUME, "80");
        //设置音量,范围 0~100
        mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD);//设置云端
        //设置合成音频保存位置(可自定义保存位置),保存在“./sdcard/iflytek.pcm”
//保存在 SD 卡需要在 AndroidManifest.xml 添加写 SD 卡权限
// 仅支持保存为 pcm 和 wav 格式,如果不需要保存合成音频,注释该行代码
// mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, "./sdcard/iflytek.pcm"); //3.开始合成
        String trim = mResultText.getText().toString().trim();
        if (TextUtils.isEmpty(trim)) {
            mTts.startSpeaking("主人，你好像还没有说话哦！", this);
        }else {
            mTts.startSpeaking(trim, this);
        }
    }

集成更多讯飞功能，请参考讯飞开发者api

以上就是简单的集成讯飞sdk的“语音输入”和“语音合成”功能，如果你在集成过程中出现一些问题，可以参考这里解决：讯飞社区，搜索你出现的错误，应该很容易解决。

关于作者
- 个人主页：Hsia
- Email：xiaweifeng@live.cn

倾锋落颖花

关注

1
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
AndroidStudio集成科大讯飞语音SDK

AndroidStudio集成科大讯飞语音SDK讯飞开放平台作为全球首个开放的智能交互技术服务平台，致力于为开发者打造一站式智能人机交互解决方案。用户可通过互联网、移动互联网，使用任何设备、在任何时间、任何地点，随时随地享受讯飞开放平台提供的“听、说、读、写……”等全方位的人工智能服务。目前，开放平台以“云+端”的形式向开发者提供语音合成、语音识别、语音唤醒、语义理解、人脸识别、个性化彩铃、移动应用
复制链接

扫一扫