Destiny的博客

菜鸟一个,在学习中

Android 科大讯飞 语音听写

这几天在搞一个语音识别的项目 用到i的是科大讯飞的语音服务,第一次搞语音识别,在这里记录一下,也希望对大家有用。废话不多说进入正题

一、要用到科大讯飞的语音识别功能,肯定是要他的开发者平台申请账号,创建应用,拿到对应的8位数的key

然后下载语音识别的sdk(上图中左边有sdk下载)

二、为自己的应用开通语音识别服务

在科大讯飞开放平台里左上角的产品服务里面选择语音识别进入到里面的页面,立即开通,选择自己的应用确定开通即可


三、sdk在android studio中的集成

官方网站有给出具体的集成方案给出链接(点击打开链接

四、具体代码

 初始化

把12345678换为你申请的应用的八位数key

SpeechUtility.createUtility(context, SpeechConstant.APPID +"=12345678");
 Main'Act'ivi
    // 语音听写对象
    private SpeechRecognizer mIat;

    // 语音听写UI
    private RecognizerDialog mIatDialog;

    // 用HashMap存储听写结果
    private HashMap<String, String> mIatResults = new LinkedHashMap<String, String>();

    // 引擎类型
    private String mEngineType = SpeechConstant.TYPE_CLOUD;
 @Override
    protected void onCreate(Bundle savedInstanceState) {
        super.onCreate(savedInstanceState);
        setContentView(R.layout.activity_main);

        initSpeech();

        btn_in_message.setOnClickListener(new View.OnClickListener() {
            @Override
            public void onClick(View v) {
                speech();
            }
        });

        btn_sent_pro.setOnClickListener(new View.OnClickListener() {
            @Override
            public void onClick(View v) {
                send(et_in_message.getText().toString());
            }
        });
    }


//初始化语音
    private void initSpeech() {
        mIat = SpeechRecognizer.createRecognizer(MainActivity.this, mInitListener);
        mIatDialog = new RecognizerDialog(MainActivity.this, mInitListener);
        mSharedPreferences = MainActivity.this.getSharedPreferences("com.iflytek.setting",      Activity.MODE_PRIVATE);
    }
    /***
     * 初始化听写
     */
    private InitListener mInitListener = new InitListener() {

        @Override
        public void onInit(int code) {
            if (code != ErrorCode.SUCCESS) {
                showTip("初始化失败,错误码:" + code);
            }
        }
    };



/**
     * 语音监听器。
     */
    private RecognizerListener mRecognizerListener = new RecognizerListener() {

        @Override
        public void onBeginOfSpeech() {
            // 此回调表示:sdk内部录音机已经准备好了,用户可以开始语音输入
            showTip("开始说话");
        }

        @Override
        public void onError(SpeechError error) {
            // Tips:
            // 错误码:10118(您没有说话),可能是录音机权限被禁,需要提示用户打开应用的录音权限。
            // 如果使用本地功能(语记)需要提示用户开启语记的录音权限。
            showTip(error.getPlainDescription(true));
        }

        @Override
        public void onEndOfSpeech() {
            showTip("结束说话");
        }

        @Override
        public void onResult(RecognizerResult results, boolean isLast) {
            Log.d("音频", results.getResultString());
        }

        @Override
        public void onVolumeChanged(int volume, byte[] data) {
            showTip("当前正在说话,音量大小:" + volume);
            Log.d("音频", "返回音频数据:" + data.length);
        }

        @Override
        public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {
            // 以下代码用于获取与云端的会话id,当业务出错时将会话id提供给技术支持人员,可用于查询会话日志,定位出错原因
            // 若使用本地能力,会话id为null
            //	if (SpeechEvent.EVENT_SESSION_ID == eventType) {
            //		String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID);
            //		Log.d(TAG, "session id =" + sid);
            //	}
        }
    };

private void speech() {
 
        FlowerCollector.onEvent(MainActivity.this, "iat_recognize");

        // 设置参数
        setParam();

        boolean isShowDialog = mSharedPreferences.getBoolean(getString(R.string.pref_key_iat_show), true);

        if (isShowDialog) {
            // 显示听写对话框
            mIatDialog.setListener(mRecognizerDialogListener);
            mIatDialog.show();
            txt = (TextView)mIatDialog.getWindow().getDecorView().findViewWithTag("textlink");
            txt.setText("");
            showTip(getString(R.string.text_begin));
        } else {
            // 不显示听写对话框
            retCode = mIat.startListening(mRecognizerListener);
            if (retCode != ErrorCode.SUCCESS) {
                showTip("听写失败,错误码:" + retCode);
            } else {
                Log.e("tingxie:", "失败");
                showTip(getString(R.string.text_begin));
            }
        }
    }

    /**
     * 听写回调监听器
     */
    private RecognizerDialogListener mRecognizerDialogListener = new RecognizerDialogListener() {
        public void onResult(RecognizerResult results, boolean isLast) {
            printResult(results); //结果解释在后面给出工具类
        }

        /**
         * 识别回调错误.
         */
        public void onError(SpeechError error) {
            showTip(error.getPlainDescription(true));
        }

    };



工具类
    private void printResult(RecognizerResult results) {
        String text = Tool.parseIatResult(results.getResultString());

        Log.e("结果:", text);

        if (!"".equals(text)) {
            send(text);
        }

    String sn = null;
        // 读取json结果中的sn字段
        try {
            JSONObject resultJson = new JSONObject(results.getResultString());
            sn = resultJson.optString("sn");
        } catch (JSONException e) {
            e.printStackTrace();
        }

        mIatResults.put(sn, text);

        StringBuffer resultBuffer = new StringBuffer();

        for (String key : mIatResults.keySet()) {
            resultBuffer.append(mIatResults.get(key));
        }

        et_in_message.setText(resultBuffer.toString());
        et_in_message.setSelection(et_in_message.length());
}

解释Tool
public static String parseIatResult(String json) {
        StringBuffer ret = new StringBuffer();
        try {
            JSONTokener tokener = new JSONTokener(json);
            JSONObject joResult = new JSONObject(tokener);

            JSONArray words = joResult.getJSONArray("ws");
            for (int i = 0; i < words.length(); i++) {
                // 转写结果词,默认使用第一个结果
                JSONArray items = words.getJSONObject(i).getJSONArray("cw");
                JSONObject obj = items.getJSONObject(0);
                ret.append(obj.getString("w"));
//				如果需要多候选结果,解析数组其他字段
//				for(int j = 0; j < items.length(); j++)
//				{
//					JSONObject obj = items.getJSONObject(j);
//					ret.append(obj.getString("w"));
//				}
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        return ret.toString();
    }
代码就到这里了,大家可以去试下 ,有什么问题欢迎提问(写的可能有错误欢迎提出错误)







阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/InnovationAD/article/details/79247245
文章标签: android
个人分类: 语音识别
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭