android语音识别之科大讯飞语音API的使用

最新推荐文章于 2024-03-22 09:48:37 发布

CreAmazing

最新推荐文章于 2024-03-22 09:48:37 发布

阅读量3.8w

点赞数 3

分类专栏：语音识别 android 科大讯飞文章标签： android button layout bt string null

本文链接：https://blog.csdn.net/zhwycan/article/details/7274863

版权

android 同时被 3 个专栏收录

9 篇文章 0 订阅

订阅专栏

语音识别

2 篇文章 0 订阅

订阅专栏

科大讯飞

2 篇文章 0 订阅

订阅专栏

Android系统本身其实提供有语音识别模块，在它的APIDemo里也有关于语音识别的sample，不过经过大多开发者的真机测试，发现很多真机并不能使用哪个sample，在网上查找了一下原因，大部分是因为开发者在刷机的时候，大部分的ROM都阉割掉了语音识别和语音合成TTS(Text To Speech)部分，所以运行sample的时候会有异常抛出。

如果不用google提供的语音识别，要怎么实现语音识别喃？科大讯飞的语音API就可以到，这里是关于它的官网介绍：http://dev.voicecloud.cn/developer.php?vt=1 下面我就用一个简单的实例来介绍一下它基本的使用

首先做一个简单的界面

上面的TextView显示识别的内容，三个Button分别为语音识别，语音合成并朗读和语音后台朗读三个功能

布局文件：

<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android"
    android:layout_width="fill_parent"
    android:layout_height="fill_parent"
    android:orientation="vertical" >

    <EditText
        android:id="@+id/et"
        android:layout_width="fill_parent"
        android:layout_height="wrap_content" />

    <Button
        android:id="@+id/bt_recognize"
        android:layout_width="fill_parent"
        android:layout_height="wrap_content"
        android:gravity="center"
        android:text="Recognize" />

    <Button
        android:id="@+id/bt_speek"
        android:layout_width="fill_parent"
        android:layout_height="wrap_content"
        android:gravity="center"
        android:text="Speek" />

    <Button
        android:id="@+id/bt_speek_bg"
        android:layout_width="fill_parent"
        android:layout_height="wrap_content"
        android:gravity="center"
        android:text="Speek-Background" />

</LinearLayout>

Activity代码如下：

package sina.CreAmazing.voice;

import java.util.ArrayList;

import com.iflytek.speech.RecognizerResult;
import com.iflytek.speech.SpeechError;
import com.iflytek.speech.SynthesizerPlayer;
import com.iflytek.ui.RecognizerDialog;
import com.iflytek.ui.RecognizerDialogListener;
import com.iflytek.ui.SynthesizerDialog;
import com.iflytek.ui.SynthesizerDialogListener;

import android.app.Activity;
import android.os.Bundle;
import android.view.View;
import android.view.View.OnClickListener;
import android.widget.Button;
import android.widget.EditText;

public class Voice1Activity extends Activity {
	/** Called when the activity is first created. */
	// 声明控件
	private EditText et;
	private Button bt1;
	private Button bt2;
	private Button bt3;
	//全局只设一个String，因为String为final类型，这样做节省内存
	String text = "";
	private static final String APPID = "appid=4f2d3a06";

	@Override
	public void onCreate(Bundle savedInstanceState) {
		super.onCreate(savedInstanceState);
		setContentView(R.layout.main);
		bt1 = (Button) findViewById(R.id.bt_recognize);
		bt2 = (Button) findViewById(R.id.bt_speek);
		bt3 = (Button) findViewById(R.id.bt_speek_bg);
		et = (EditText) findViewById(R.id.et);
		// 初始化监听器
		initListener();

	}

	private void initListener() {
		bt1.setOnClickListener(myListener);
		bt2.setOnClickListener(myListener);
		bt3.setOnClickListener(myListener);

	}

	OnClickListener myListener = new OnClickListener() {

		@Override
		public void onClick(View v) {
			// 根据不同View的id调用不同方法
			switch (v.getId()) {
			case R.id.bt_recognize:
				// 这是语言识别部分，最重要的实例化一个
				// RecognizerDialog并把你在官方网站申请的appid填入进去，非法id不能进行识别
				RecognizerDialog isrDialog = new RecognizerDialog(
						Voice1Activity.this, APPID);

				/*
				 * 设置引擎目前支持五种 ”sms”：普通文本转写 “poi”：地名搜索 ”vsearch”：热词搜索
				 * ”video”：视频音乐搜索 ”asr”：命令词识别
				 */
				isrDialog.setEngine("sms", null, null);
				isrDialog.setListener(recoListener);
				isrDialog.show();
				break;
			case R.id.bt_speek:
				// 这是语言合成部分 同样需要实例化一个SynthesizerDialog ，并输入appid
				SynthesizerDialog syn = new SynthesizerDialog(
						Voice1Activity.this, APPID);
				syn.setListener(new SynthesizerDialogListener() {

					@Override
					public void onEnd(SpeechError arg0) {

					}
				});
				// 根据EditText里的内容实现语音合成
				syn.setText(et.getText().toString(), null);
				syn.show();
				break;
			case R.id.bt_speek_bg:
				// 这是后台朗读，实例化一个SynthesizerPlayer
				SynthesizerPlayer player = SynthesizerPlayer
						.createSynthesizerPlayer(Voice1Activity.this, APPID);
				// 设置语音朗读者，可以根据需要设置男女朗读，具体请看api文档和官方论坛
				player.setVoiceName("vivixiaomei");
				player.playText(et.getText().toString(), "ent=vivi21,bft=5",
						null);
				break;
			default:
				break;
			}

		}
	};
	// 语言识别监听器，有两个方法
	RecognizerDialogListener recoListener = new RecognizerDialogListener() {

		@Override
		public void onResults(ArrayList<RecognizerResult> results,
				boolean isLast) {
			// 服务器识别完成后会返回集合，我们这里就只得到最匹配的那一项
			text += results.get(0).text;
			System.out.println(text);
		}

		@Override
		public void onEnd(SpeechError error) {
			if (error == null) {
				// 完成后就把结果显示在EditText上
				et.setText(text);
			}

		}

	};

}

最后别忘了把科大讯飞的jar包引入工程的buildPath里面。

运行画面：

语音识别：

语音合成：

其实功能还不止这些，还有数据上传，关键字识别，获取上行下行流量，设置采样频率设置发音人，语速，音量等等等，如果感兴趣可以自己深入研究。

下一篇我会尝试着通过语言简单的控制手机，使语音识别功能更加丰富

CreAmazing

关注

3
点赞
踩
23

收藏

觉得还不错? 一键收藏
14
评论
android语音识别之科大讯飞语音API的使用

Android系统本身其实提供有语音识别模块，在它的APIDemo里也有关于语音识别的sample，不过经过大多开发者的真机测试，发现很多真机并不能使用哪个sample，在网上查找了一下原因，大部分是因为开发者在刷机的时候，大部分的ROM都阉割掉了语音识别和语音合成TTS(Text To Speech)部分，所以运行sample的时候会有异常抛出。如果不用google提供的语音识别，要怎么实现
复制链接

扫一扫