基于安卓的智能语音识别系统

45 篇文章 3 订阅

语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译[5]。在android应用程序中加入语音识别API,就可以大大的省去了一些人们的手势操作,对于一些行动不方便的人群或者是老人人群来说,无疑是一大福音。正常人在某些特殊时候,在不方便手势操作APP的时候,也是可以通过语音来操作的,例如一些用户在开车的时候,可能不方便操作APP,就可以进行语音操作APP.因此,本次设计的目的就是设计开发一款可以语音识别和语音合成,方便人们操作的android 应用。

在本次设计最初,通过对于一些市场上的语音相关的手机应用的使用情况进行了调查,调查的对象涉及在校大学生,上班商务人员和政府单位公务人员。了解到对于APP软件目前最大的需要大致有一下几点,一是可以输入语音,识别语音的内容,然后根据识别的内容再进行相关的操作,二是可以录入文本信息然后合成语音,合成语音后会将语音文件保存,并同时将文本信息朗读出来。

 本设计的各种功能主要集中在客户端也就是手机APP中,为了人们可以更加方便的出行,我们结合了前期调研的结果,特别是针对于人们反应出的两大需求,我们对手机APP的设计做了一些有新意的设计;

(1)本App的客户端基于Android系统,对于使用该App的用户来说,可以通过手机更方便地操控手机应用,实现“智能化”的操作手机和输入指示命令,具体功能大致如下:

1)语音识别:用户在“语音合成”界面点击开始后,会调取手机麦克风,此时会有科大讯飞封装好提供的对话话,提示用户请说话,用户在录入语音结束后,会调用科大讯飞的语音识别的算法,来识别语音中的内容,进而再根据语音中的内容来判断执行相应的命令,例如跳转到微信,查询某个城市的天气,播放音乐,进行音乐的切换等功能。

2)语音合成:用户在“语音合成”的界面,会看到有一文本输入框(EditText控件),用户在文本框中输入文字信息,后点击合成,就会调用科大讯飞的相关算法API,将文本信息合成语音文件,并提升用户文件所保存的路径,同时会将文本信息朗读出来,朗读时可以分为男声朗读和女声朗读。

 

 主要功能模块的实现

在调研及需求分析后,我们得出本App的基本功能大致包括个人中心模块,语音合成模块以及语音识别等几个功能模块。各个功能设计的具体说明大致如下:

1)语音识别模块

用户在成功登录APP,进入应用的主界面时,在“语音识别”的界面中,这一模块是本次设计的核心内容,也是本款APP实现的核心功能。用户可以选择“云端”还是“混合”的方式进行语音识别的解析,这是科大讯飞API中提供的方法,

用户点击“开始”后,会弹出提示框,提示用户录入语音,用户录入语音完毕,就会执行科大讯飞的算法分析,算法分析返回的结果不是字符串,还需要进行字符串的转换,只要转换成字符串以后,才能变成android代码能识别的“文字语言信息”,在识别到相关命令后开始执行相应的功能,本次设计实现了三个语音命令:1)语音控制打开应用,主要包括打开一些常用的APP软件,如支付宝、微信、微博等第三方应用。2)查询天气,用户可以输入命令查询某个城市的天气,例如查询济南,泰安的天气等,天气数据来源于易源接口的提供的数据。3)播放音乐,用户输入语音命令后,会进入到音乐播放的界面,用户可以语音控制音乐的播放,暂停,以及上一首和下一首等。

2)语音合成模块

用户登陆App之后,可以在主界面中看到“语音合成”图标。通过前面的分析,我们知道了用户的两大需求:1.可以语音识别。2.可以在线合成语音,这个省去了人们传统的只能依赖于文本输入的麻烦。所以,在这一模块中主要就是针对上述这这个需求来进行设计。其中,用户在文本框中输入文字信息,后点击合成,就会调用科大讯飞的相关算法API,将文本信息合成语音文件。至此,本次设计的核心供能也基本上就完全实现了。

个人中心模块

用户登陆App之后,可以在主界面中看到“退出应用”图标,单击即可返回结束退出当前应用,并重新跳转到用户登录界面,需要用户重新输入密码和账号进行服务端校验成功后,再次进入应用。用户登陆App之后,可以在主界面的下方中看到“个人中心”图标,单击即可跳转到当前界面,当然手指左右滑动手机屏幕也可以切换至当前界面。然后可以看到在个人中心中显示的信息有“用户头像”“用户名”“性别”,“年龄”。其中点击用户头像可选择手机本地图库里的图片进行上传,在此处本次设计实现了图片的圆形裁剪。“用户名”,“性别”,“年龄”不允许更改,在用户进行注册时获取到这些信息,在进入程序后显示给用户。“职业”和“联系电话”可虑到他们自身属性的不稳定性,在本次设计中采用的是用户可点击进行修改,当用户点击上述两个控件显示的内容的时候,会弹出一个对话框提示用户来编辑要修改的信息。

 

参考文献

[1]王超,张亮,张宏彬,等.基于安卓医疗客户端设计初探.电子技术与软件工程,2014,09:44-45 

[2]闫素旺.基于安卓平台的医生在线的设计与实现. [河北工业大学硕士论文].天津:河北工业大学, 2013

[3]林永兴, 李晓蕾. 基于 Android 的应用程序的研究与设计.硅谷, 2012, 03: 60

[4]王栓宝.基于WEB的医疗系统的设计与实现.  [河北科技大学硕士论文].石家庄:河北科技大学, 2014

[5]段琳.深入剖析Android Activity.中国新技术新产品, 2011, 16: 33-34

[6]郭宏志. Android应用开发详解.北京:电子工业出版社, 2010

[7]汪永松. Android手机应用开发之信息平台移动客户端.电脑编程技巧与维护, 2013, 13:29-37

[8]曲欣. JAVA应用数据库技术.信息与电脑 (理论版), 2009, 07: 95

[9]魏斌.高性能SQLITE集群部署.河南科技, 2014, 14: 6-9

[10]贺蕴彬.基于My SQL数据库的在线选课系统.电脑知识与技术, 2014, 05: 883-885

[11潘港超,焦佳彭,耶萍.基于Android系统的WIFI技术探究.电脑编程技巧与维护, 2015, 03: 38-39

[12]李天陵.浅析互联网行业.科学咨询 (决策管理), 2009, 12: 72-73

[13]黄崇本. 深入探究春雨医生.浙江工商职业技术学院学报, 2002, 01 

[14]王超,张亮,张宏彬,等.基于安卓的客户端设计初探.电子技术与软件工程, 2014, 09: 44-45

[15]张亚杰.基于Android平台的移动终端应用程序的研究与开发 [郑州大学硕士论文].郑州:郑州大学, 2013

[16]郑晓霞.基于Android的新华社新闻客户端研发与探索.中国传媒科技, 2013, 15: 82-85

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值