Android应用开发进阶篇-场景文字识别

本文介绍了如何在Android应用中实现场景文字识别。通过客户端拍摄图片,选定区域,利用socket通信上传到Python服务器,服务器调用识别引擎并返回结果。在Android编程中需要注意主线程不能直接建立网络连接,子线程不能更新UI,以及服务器端返回结果需加换行符等问题。
摘要由CSDN通过智能技术生成

        由于研究生毕业项目需要完成一个基于移动终端的场景文字识别系统,虽然离毕业尚早,但出于兴趣的缘故,近一段抽时间完成了这样一套系统。基本的架构如下:

        客户端:Android应用实现拍摄场景图片,大致划出感兴趣文字区域,通过socket通信上传服务器端识别;

        服务器端:Python server进行socket通信监听,连通后调用文字识别引擎(exe可执行程序),将识别结果返回;


下面是系统运行示例图:



1. 客户端

包含两个Activity,: MainActivity主界面如上图左1,选择拍摄后调用系统内部的拍照服务如上图左2;拍照完成进入KernelActivity如上图左3,大致划出感兴趣文字区域后上传服务器端,获取识别结果如上图左4。


客户端拍照和建立网络通信需要注意在AndroidManifestxml文件中声明权限

    <!-- 授权使用相机 -->
    <uses-permission android:name="android.permission.CAMERA" />
    <!-- 在SD卡中创建与删除文件的权限 -->
    <uses-permission android:name="android.permission.MOUNT_UNMOUNT_FILESYSTEMS" />
    <!-- 
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值