新视野智能导盲眼镜

 我国是世界上盲人最多的国家之一,存在600多万眼部残疾人士,占世界眼疾人数的18%。眼部疾病在中国也是一个主要的公共卫生问题。由于生理上的缺陷,盲人在生活、工作等方面有着诸多不便。

基于盲人自身墨镜的必须性以及穿戴品的可携带性,我们想要在这一穿戴品上做一些创新,设计一个可以用于导盲的多功能眼镜。在两个镜片上加上传感器和微型摄像头进行对道路的识别,将识别的物体与已有的库及进行对比,得出物体的名称,再于眼镜的末端各安置一个微型扬声器,将物体的距离大小以及名称报给盲人,这样就可以帮助他们通过声音识别路障并且安全避开,以达到常人眼观六路耳听八方的能力。
对于此眼镜的设计,主要分为以下三个方面:
图像采集与处理:一种方案是考虑双目采集原理,双目采集模块选用两个性能参数完全一致的CMOS高清摄像头,用于智能导盲眼镜前方场景信息的采集,帮助盲人获取前方目标和相应的场景信息。对于图像采集要尝试多种采集器,主要依靠图像采集卡处理,而图像采集卡是图像采集部分和图像处理部分的接口。图象经过采样、量化以后转换为数字图象并输入、存储到帧存储器。由于图像信号的传输需要很高的传输速度,通用的传输接口不能满足要求,因此需要图像采集卡。
通过高速PCI总线可实现直接采集图象到VGA显存或主机系统内存,可以使图象直接采集到VGA,实现单屏工作方式,也可以利用PC机内存的可扩展性,实现所需数量的序列图象逐帧连续采集,进行序列图象处理分析。此外,由于图象可直接采集到主机内存,图象处理可直接在内存中进行,因此图象处理的速度随CPU速度的不断提高而得到提高,因而使得对主机内存的图象进行并行实时处理成为可能。
视频(Video)是多幅静止图像(图像帧)与连续的音频信息在时间轴上同步运动的混合媒体,多帧图像随时间变化而产生运动感,因此视频也被称为运动图像。由此很多时候采集卡,被人们称为视频采集卡和图像采集卡。
一般图像采集卡和其他的1394卡差不多,都是一块芯片,链接在台式机的PCI扩展槽上,就是显卡旁边的插槽,经过高速PCI总线能够直接采集图象到VGA显存或主机系统内存,此外不仅可以使图象直接采集到VGA,实现单屏工作方式,而且可以利用PC机内存的可扩展性,实现所需数量的序列图象逐帧连续采集,进行序列图象处理分析。此外,由于图象可直接采集到主机内存,图象处理可直接在内存中进行,因此图象处理的速度随CPU速度的不断提高而得到提高,因而使得对主机内存的图象进行并行实时处理成为可能。
另一种方案是应用已经集成好的openmv模块,它虽然在运行速度和效能上和操作系统上运行的opencv有一些区别,但是仍然是可以接受的,openmv搭载了stm32f7系列最高端的芯片,在一些方面性能还是可以满足的,而且openmv只有14g,重量和体积都很小,很好的满足了我们可穿戴设备的要求,也适用与我们这些初学者入手。Openmv底层采用python编写,较为简单,使用者不需要过多的考虑底层的编写,随着需要的增加,可以再慢慢入手底层,而且openmv的帧数可以达到每秒钟85到90.对于图像处理来说已经足够。
采用openmv目前最大的一个难度是视觉定位,单一的一个摄像头难以实现障碍物的定位,从而容易给盲人造成信息错报,容易发生危险,目前打算采用高精度且带有温度补偿的超声波测距,但这就需要使用者在使用是保证超声波时刻在头的正前方。
语音模块:智能导盲眼镜控制系统的语音播报功能主要用于将导盲眼镜前方目标的图片识别结果、距离、方位信息以及所处的地理位置通过语音模块播放出来,及时告知盲人所处的周围环境状况。系统选用SYN6288中文语音合成芯片作为语音播报模块的主体,实现文本到声音的转换
SYN6658通过UART接口或SPI接口通讯方式,接受带合成的文本数据,实现文本到语音的转换。具有清晰、自然、准确的中文语音合成效果。可采用GB2312、GBK、BIG5和Unicode四种编码方式[组]。主控制器和SYN6658语音合成芯片之间通过UART接口或SPI接口连接,控制器可通过通讯接口向SYN6658语音合成芯片发送控制命令和文本,SYN6658语音合成芯片把接收到的文本合成为语音信号输出,输出的信号经功率放大器放大后连接到喇叭进行播放。
SYN6658支持语音编解码功能,用户可以使用芯片直接进行录音和播放。芯片内部集成了语音编码单元和解码单元,可以进行语音的编码和解码,实现录音和播放功能。芯片的语音编解码具备高压缩率、低失真率、低延时的特点,并且可以支持多种语音编码解码速率。这些特性使它非常适合于数字语音通信、语音存储以及其它需要对语音进行数字处理的场合。支持语音识别功能,可支持30个命令词的识别。芯片出默认设置的是30个车载、预警等行业常用识别命令词。客户如需要更改成其他的识别命令词,可进行命令词定制。
语音合成系统中,主控制器和XFS5152CE芯片之间可以通过UART 接口、或者I2C 接口、或者SPI 接口连接,控制器可通过上述通讯接口向XFS5152CE 芯片发送控制命令和文本,XFS5152CE 芯片接收到文本后合成为语音信号输出,输出的信号经功率放大器进行放大后连接到喇叭进行播放。
在使用语音识别功能时,上位机发送启动语音识别功能的命令给语音芯片,芯片把从麦克风采集到的语音数据,通过内部的识别模块进行转换成相应的识别结果,通过通讯接口回传给控制器。
在使用语音编解码功能时(通讯接口选择UART 接口,并且波特率设置为115200bps),上位机发送启动编解码的命令给语音芯片,芯片内部的语音编解码模块把采集到的音频数据进行编码并通过UART 接口实时传送给上位机,或者对上位机传送来的音频数据进行解码并实时播放出来。

include

include

  • 8
    点赞
  • 46
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值