Android 讯飞语音合成、语音播报(详细步骤+源码)(1)

然后在AndroidManifest.xml中配置

在这里插入图片描述

三、功能编写


合成语音可以选择保存文件到本地,因此需要读写文件权限。刚才在AndroidManifest.xml中配置静态权限,而在Android6.0以后危险的权限需要动态申请,需要用户授权才可以使用。

① 权限请求

/**

  • 请求权限

*/

private void requestPermissions() {

try {

//Android6.0及以上版本

if (Build.VERSION.SDK_INT >= Build.VERSION_CODES.M) {

int permission = ActivityCompat.checkSelfPermission(this,

Manifest.permission.WRITE_EXTERNAL_STORAGE);

if (permission != PackageManager.PERMISSION_GRANTED) {

ActivityCompat.requestPermissions(this, new String[]

{Manifest.permission.WRITE_EXTERNAL_STORAGE,

Manifest.permission.WRITE_SETTINGS,

Manifest.permission.READ_EXTERNAL_STORAGE}, 0x0010);

}

}

} catch (Exception e) {

e.printStackTrace();

}

}

然后返回

/**

  • 权限请求返回结果

*/

@Override

public void onRequestPermissionsResult(int requestCode, String[] permissions, int[] grantResults) {

super.onRequestPermissionsResult(requestCode, permissions, grantResults);

}

在onCreate中调用requestPermissions()方法。

② 页面初始化

修改activity_main.xml

<?xml version="1.0" encoding="utf-8"?>

<LinearLayout xmlns:android=“http://schemas.android.com/apk/res/android”

xmlns:app=“http://schemas.android.com/apk/res-auto”

xmlns:tools=“http://schemas.android.com/tools”

android:layout_width=“match_parent”

android:layout_height=“match_parent”

android:orientation=“vertical”

tools:context=“.MainActivity”>

<EditText

android:id=“@+id/et_text”

android:gravity=“top|left”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”/>

<Button

android:id=“@+id/btn_play”

android:text=“开始合成”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”/>

<Button

android:id=“@+id/btn_cancel”

android:text=“取消”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”/>

<Button

android:id=“@+id/btn_pause”

android:text=“暂停播放”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”/>

<Button

android:id=“@+id/btn_resume”

android:text=“继续播放”

android:layout_width=“match_parent”

android:layout_height=“wrap_content”/>

然后进入到MainActivity,

//输入框

private EditText etText;

新增一个initView方法。

/**

  • 初始化页面

*/

private void initView() {

etText = findViewById(R.id.et_text);

findViewById(R.id.btn_play).setOnClickListener(this);

findViewById(R.id.btn_cancel).setOnClickListener(this);

findViewById(R.id.btn_pause).setOnClickListener(this);

findViewById(R.id.btn_resume).setOnClickListener(this);

}

实现View.OnClickListener

在这里插入图片描述

然后重写onClick

/**

  • 页面点击事件

  • @param v 控件

*/

@Override

public void onClick(View v) {

switch (v.getId()) {

case R.id.btn_play://开始合成

break;

case R.id.btn_cancel://取消合成

break;

case R.id.btn_pause://暂停播放

break;

case R.id.btn_resume://继续播放

break;

default:

break;

}

}

然后在onCreate中调用initView()方法。

③ 初始化语音合成对象

// 语音合成对象

private SpeechSynthesizer mTts;

新增一个初始化语音合成对象的监听。

/**

  • 初始化监听。

*/

private InitListener mTtsInitListener = new InitListener() {

@Override

public void onInit(int code) {

Log.i(TAG, "InitListener init() code = " + code);

if (code != ErrorCode.SUCCESS) {

showTip(“初始化失败,错误码:” + code);

} else {

showTip(“初始化成功”);

}

}

};

再增加一个showTip方法

/**

  • Toast提示

  • @param msg

*/

private void showTip(String msg) {

Toast.makeText(this, msg, Toast.LENGTH_SHORT).show();

}

然后在onCreate中写入如下代码

// 初始化合成对象

mTts = SpeechSynthesizer.createSynthesizer(this, mTtsInitListener);

在这里插入图片描述

在onClick中,点击按钮之前先判断一下是否不为空,避免程序空指针崩溃。

if (mTts == null) {

this.showTip(“创建对象失败,请确认 libmsc.so 放置正确,且有调用 createUtility 进行初始化”);

return;

}

在这里插入图片描述

④ 参数设置

设置发音人和引擎类型

// 默认发音人

private String voicer = “xiaoyan”;

// 引擎类型

private String mEngineType = SpeechConstant.TYPE_CLOUD;

然后新增一个setParam()方法

/**

  • 参数设置

  • @return

*/

private void setParam() {

// 清空参数

mTts.setParameter(SpeechConstant.PARAMS, null);

// 根据合成引擎设置相应参数

if (mEngineType.equals(SpeechConstant.TYPE_CLOUD)) {

mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_CLOUD);

//支持实时音频返回,仅在synthesizeToUri条件下支持

mTts.setParameter(SpeechConstant.TTS_DATA_NOTIFY, “1”);

// 设置在线合成发音人

mTts.setParameter(SpeechConstant.VOICE_NAME, voicer);

} else {

mTts.setParameter(SpeechConstant.ENGINE_TYPE, SpeechConstant.TYPE_LOCAL);

mTts.setParameter(SpeechConstant.VOICE_NAME, “”);

}

// 设置播放合成音频打断音乐播放,默认为true

mTts.setParameter(SpeechConstant.KEY_REQUEST_FOCUS, “false”);

// 设置音频保存路径,保存音频格式支持pcm、wav

mTts.setParameter(SpeechConstant.AUDIO_FORMAT, “pcm”);

mTts.setParameter(SpeechConstant.TTS_AUDIO_PATH, getExternalFilesDir(null) + “/msc/tts.pcm”);

}

⑤ 语音合成监听

语音合成是需要设置资源的,如下所以,可以设置一个默认的,当然了布局中有一个输入框,在你不输入的时候就使用这个默认值。

//播放的文字

String text = “富强、明主、文明、和谐、自由、平等、公正、法制、爱国、敬业、诚信、友善。”;

然后创建一个语音合成的监听

/**

  • 合成回调监听。

*/

private SynthesizerListener mTtsListener = new SynthesizerListener() {

//开始播放

@Override

public void onSpeakBegin() {

}

//暂停播放

@Override

public void onSpeakPaused() {

}

//继续播放

@Override

public void onSpeakResumed() {

}

//合成进度

@Override

public void onBufferProgress(int percent, int beginPos, int endPos, String info) {

}

//播放进度

@Override

public void onSpeakProgress(int percent, int beginPos, int endPos) {

}

//播放完成

@Override

public void onCompleted(SpeechError error) {

}

//事件

@Override

public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {

}

};

这里重写了七个方法,下面一个一个来。

首先是onSpeakBegin,里面就打印一句话就可以了。

//开始播放

@Override

public void onSpeakBegin() {

Log.i(TAG, “开始播放”);

}

onSpeakPaused

//暂停播放

@Override

public void onSpeakPaused() {

Log.i(TAG, “暂停播放”);

}

onSpeakResumed

//继续播放

@Override

public void onSpeakResumed() {

Log.i(TAG, “继续播放”);

}

onBufferProgress

//合成进度

@Override

public void onBufferProgress(int percent, int beginPos, int endPos, String info) {

Log.i(TAG, “合成进度:” + percent + “%”);

}

onSpeakProgress,这个方法可以去设置播放的语句的样式。

//播放进度

@Override

public void onSpeakProgress(int percent, int beginPos, int endPos) {

// 播放进度

Log.i(TAG, “播放进度:” + percent + “%”);

SpannableStringBuilder style = new SpannableStringBuilder(text);

style.setSpan(new BackgroundColorSpan(Color.RED), beginPos, endPos, Spannable.SPAN_EXCLUSIVE_EXCLUSIVE);

etText.setText(style);

}

然后在当前Activity中再增加三个变量

private Vector<byte[]> container = new Vector<>();

//内存文件

MemoryFile memoryFile;

//总大小

public volatile long mTotalSize = 0;

onCompleted

//播放完成

@Override

public void onCompleted(SpeechError error) {

if (error == null) {

Log.i(TAG, “播放完成,” + container.size());

DebugLog.LogD(“播放完成,” + container.size());

for (int i = 0; i < container.size(); i++) {

//写入文件

writeToFile(container.get(i));

}

//保存文件

FileUtil.saveFile(memoryFile, mTotalSize, getExternalFilesDir(null) + “/1.pcm”);

} else {

//异常信息

showTip(error.getPlainDescription(true));

}

}

播放完成之后写入文件

/**

  • 写入文件

*/

private void writeToFile(byte[] data) {

if (data == null || data.length == 0) {

return;

}

try {

if (memoryFile == null) {

Log.i(TAG, “memoryFile is null”);

String mFilepath = getExternalFilesDir(null) + “/1.pcm”;

memoryFile = new MemoryFile(mFilepath, 1920000);

memoryFile.allowPurging(false);

}

memoryFile.writeBytes(data, 0, (int) mTotalSize, data.length);

mTotalSize += data.length;

} catch (Exception e) {

e.printStackTrace();

}

}

onEvent,这个方法主要是用于给讯飞的技术支持人员发送消息。

//事件

@Override

public void onEvent(int eventType, int arg1, int arg2, Bundle obj) {

// 以下代码用于获取与云端的会话id,当业务出错时将会话id提供给技术支持人员,可用于查询会话日志,定位出错原因

// 若使用本地能力,会话id为null

if (SpeechEvent.EVENT_SESSION_ID == eventType) {

String sid = obj.getString(SpeechEvent.KEY_EVENT_SESSION_ID);

Log.i(TAG, “session id =” + sid);

}

//当设置SpeechConstant.TTS_DATA_NOTIFY为1时,抛出buf数据

if (SpeechEvent.EVENT_TTS_BUFFER == eventType) {

byte[] buf = obj.getByteArray(SpeechEvent.KEY_EVENT_TTS_BUFFER);

Log.i(TAG, “bufis =” + buf.length);

container.add(buf);

}

}

⑥ 点击按钮触发

在onClick中,开始合成

case R.id.btn_play://开始合成

//输入文本

String etStr = etText.getText().toString().trim();

if (!etStr.isEmpty()) {

text = etStr;

}

//设置参数

setParam();

//开始合成播放

int code = mTts.startSpeaking(text, mTtsListener);

if (code != ErrorCode.SUCCESS) {

showTip("语音合成失败,错误码: " + code);

}

break;

这里代码很简单就是先判断输入框是否有值,有则使用输入框中的值,没有则使用默认值,然后就是设置参数,最后就是语音合成,传入要合成的文本,并且传入合成监听,会返回一个code,用于判断此语音是否合成成功,不成功会返回5位数的错误码,这个错误码可以在错误码查询中查看具体的错误原因。

然后就是另外几个按钮的点击事件了,这个就比较简单了。

case R.id.btn_cancel://取消合成

mTts.stopSpeaking();

break;

case R.id.btn_pause://暂停播放

mTts.pauseSpeaking();

break;

case R.id.btn_resume://继续播放

mTts.resumeSpeaking();

break;

然后你就可以开始运行了。

在这里插入图片描述

请用真机运行。

不过由于我这是录制的GIF所以你是听不到声音的,但是你要是自己运行的话那是肯定可以的,你信我!程序员不打诳语。

其实按理来说到这里就应该结束了,不过呢,为了丰富使用场景,还要增加一些设置功能,比如发音人的音色也是可以配置的。在平台上你可以看到基础发音人有五个。

在这里插入图片描述

而刚才在代码中设置一个默认的发音人是xiaoyan。你还记得吗?

在这里插入图片描述

这里还有四个人,可以都配置一下。

⑦ 设置发音人

首先修改一下activity_main.xml文件,在继续播放按钮的下方添加如下布局代码

<LinearLayout

android:gravity=“center_vertical”

android:layout_width=“match_parent”

android:layout_height=“50dp”

android:orientation=“horizontal”

android:paddingStart=“6dp”

android:paddingEnd=“6dp”>

<View

android:layout_width=“0dp”

android:layout_height=“0.5dp”

android:layout_weight=“1”

android:background=“#000” />

<TextView

android:layout_marginStart=“6dp”

android:layout_marginEnd=“6dp”

android:layout_width=“wrap_content”

android:layout_height=“wrap_content”

android:text=“设置”

android:textColor=“#000”

android:textSize=“16sp” />

<View

android:layout_width=“0dp”

android:layout_height=“0.5dp”

android:layout_weight=“1”

android:background=“#000” />

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Android工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Android开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip204888 (备注Android)
img

写在最后

最后我想说:对于程序员来说,要学习的知识内容、技术有太多太多,要想不被环境淘汰就只有不断提升自己,从来都是我们去适应环境,而不是环境来适应我们!

这里附上上述的技术体系图相关的几十套腾讯、头条、阿里、美团等公司2021年的面试题,把技术点整理成了视频和PDF(实际上比预期多花了不少精力),包含知识脉络 + 诸多细节,由于篇幅有限,这里以图片的形式给大家展示一部分。

相信它会给大家带来很多收获:

当程序员容易,当一个优秀的程序员是需要不断学习的,从初级程序员到高级程序员,从初级架构师到资深架构师,或者走向管理,从技术经理到技术总监,每个阶段都需要掌握不同的能力。早早确定自己的职业方向,才能在工作和能力提升中甩开同龄人。

碰到天花板技术停滞不前!**

因此收集整理了一份《2024年Android移动开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
[外链图片转存中…(img-Y46vaYfT-1712068818302)]
[外链图片转存中…(img-n6fLb7t0-1712068818303)]
[外链图片转存中…(img-ZEBJrmbx-1712068818303)]
[外链图片转存中…(img-dsUjtdNq-1712068818303)]
[外链图片转存中…(img-s2kpNeWc-1712068818304)]
[外链图片转存中…(img-kdO6cyFk-1712068818304)]
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Android开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip204888 (备注Android)
[外链图片转存中…(img-DY9Y7PlA-1712068818304)]

写在最后

最后我想说:对于程序员来说,要学习的知识内容、技术有太多太多,要想不被环境淘汰就只有不断提升自己,从来都是我们去适应环境,而不是环境来适应我们!

这里附上上述的技术体系图相关的几十套腾讯、头条、阿里、美团等公司2021年的面试题,把技术点整理成了视频和PDF(实际上比预期多花了不少精力),包含知识脉络 + 诸多细节,由于篇幅有限,这里以图片的形式给大家展示一部分。

相信它会给大家带来很多收获:

[外链图片转存中…(img-EowSsT9E-1712068818304)]

[外链图片转存中…(img-N19v9PgJ-1712068818305)]

当程序员容易,当一个优秀的程序员是需要不断学习的,从初级程序员到高级程序员,从初级架构师到资深架构师,或者走向管理,从技术经理到技术总监,每个阶段都需要掌握不同的能力。早早确定自己的职业方向,才能在工作和能力提升中甩开同龄人。

本文已被CODING开源项目:《Android学习笔记总结+移动架构视频+大厂面试真题+项目实战源码》收录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值