python 安卓app按钮数字识别_基于TensorFlow的MNIST手写数字识别与Android移植

最新推荐文章于 2022-05-12 20:54:19 发布

weixin_39936403

最新推荐文章于 2022-05-12 20:54:19 发布

阅读量166

点赞数

文章标签： python 安卓app按钮数字识别

本文基于TensorFlow实现了MNIST手写数字识别，并将训练好的模型移植到了Android上。

环境配置

TensorFlow 1.0.1

Python2.7

Android Studio 2.2

主要步骤

生成pb文件：使用TensorFlow Python API 构建并训练网络，最后将训练后的网络的拓扑结构和参数保存为pb文件。

将pb文件、jar包以及so库引入Android工程中，并基于TensorFlowInferenceInterface类完成识别。

移植过程

一、生成pb文件

pb文件中保存了网络的拓扑结构和参数。为了得到pb文件需要先基于TensorFlow Python API 构建并训练网络。

1. 给网络拓扑中的关键节点指定名称

网络的输入节点和输出节点在使用tf.placeholder定义的时候必须要通过name形参指定名称，便于在将模型移植到Android后可以通过名称来获取指定节点的值，或者给指定节点赋值。

x = tf.placeholder(tf.float32, [None, height, width], name='input') #输入节点的名字这里取名为'input'

sofmax_out = tf.nn.softmax(logits,name="out_softmax") #输出节点

# keep_prob_placeholder这个节点也命名了，便于后期用于区分训练和测试。

keep_prob_placeholder = tf.placeholder(tf.float32, name='keep_prob_placeholder')

2. 将训练好后的网络模型保存为pb文件

这是通过convert_variables_to_constants(sess, input_graph_def, output_node_names,variable_names_whitelist=None)函数实现的，该函数的定义见这。

convert_variables_to_constants完成如下两件事情：（@mirosval的回答）

convert_variables_to_constants() does two things:

It freezes the weights by replacing variables with constants

It removes nodes which are not related to feedforward prediction

from tensorflow.python.framework import graph_util

constant_graph = graph_util.convert_variables_to_constants(sess, sess.graph_def, ["out_softmax"])

with tf.gfile.FastGFile(pb_file_path,mode='wb') as f:

f.write(constant_graph.SerializeToString())

二、构建jar包和so库

这里简要地总结一下主要步骤。

1. 安装 Bazel,Android NDK,Android SDK

2. 下载TensorFlow源码，修改项目根目录下的WORKSPACE文件

修改WORKSPACE文件中的Android SDK和Android NDK的配置信息，其中的路径等信息根据之前的安装情况进行修改。

本文将WORKSPACE文件的配置修改如下：

# Uncomment and update the paths in these entries to build the Android demo.

android_sdk_repository(

name = "androidsdk",

api_level = 25,

build_tools_version = "25.0.2",

# Replace with path to Android SDK on your system

path = "/home/tsiangleo/android_dev/tool/android-sdk-linux",

)

android_ndk_repository(

name="androidndk",

path="/home/tsiangleo/android_dev/tool/android-ndk-r13b",

api_level=21)

3. 构建so库

在TensorFlow源码的根目录下执行如下命令，构建so库。

bazel build -c opt //tensorflow/contrib/android:libtensorflow_inference.so \

--crosstool_top=//external:android/crosstool \

--host_crosstool_top=@bazel_tools//tools/cpp:toolchain \

--cpu=armeabi-v7a

构建成功后，可在如下目录找到so库。

bazel-bin/tensorflow/contrib/android/libtensorflow_inference.so

4. 构建jar包

在TensorFlow源码的根目录下执行如下命令，构建jar包。

bazel build //tensorflow/contrib/android:android_tensorflow_inference_java

构建成功后，可在如下目录找到jar包。

bazel-bin/tensorflow/contrib/android/libandroid_tensorflow_inference_java.jar

三、整合到Android Studio工程

以下操作针对Android Studio。

1.将pb文件放入Android项目中

打开 Project view ，app/src/main/assets。

若不存在assets目录，右键main->new->Directory，输入assets。

2.将jar包引入Android项目中

打开Project view，将jar包拷贝到app->libs下

选中jar文件，右键 add as library

3.将so库引入Android项目中

打开 Project view，将libtensorflow_inference.so文件拷贝到 app/src/main/jniLibs/armeabi-v7a下（若jniLibs/armeabi-v7a目录不存在，则先创建，方法同1。）。

4.基于TensorFlowInferenceInterface类，编写代码进行识别。

下面以识别MNIST手写数字为例来介绍，具体代码见github。

（1）定义一些关键的常量

public static final String MODEL_FILE = "file:///android_asset/mnist-tf1.0.1.pb"; //asserts目录下的pb文件名字

public static final String INPUT_NODE = "input"; //输入节点的名称

public static final String OUTPUT_NODE = "out_softmax"; //输出节点的名称

public static final String KEEP_PROB_NODE = "keep_prob_placeholder"; // keep_prob节点的名称

public static final int NUM_CLASSES = 10; //输出节点的个数，即总的类别数。

public static final int HEIGHT = 28; //输入图片的像素高

public static final int WIDTH = 28; //输入图片的像素宽

（2）创建TensorFlowInferenceInterface对象并初始化

//初始化TensorFlowInferenceInterface对象。

TensorFlowInferenceInterface inferenceInterface = new TensorFlowInferenceInterface();

//根据指定的MODEL_FILE创建一个本地的TensorFlow session

inferenceInterface.initializeTensorFlow(context.getAssets(), MODEL_FILE);

（3）输入图片的像素点，得到分类结果

// 输入数据pixelArray，pixelArray的数据类型是float[]，存放了一张图片的像素点。

inferenceInterface.fillNodeFloat(INPUT_NODE, new int[]{1, HEIGHT, WIDTH}, pixelArray);

inferenceInterface.fillNodeFloat(KEEP_PROB_NODE,new int[]{1},new float[]{1.0f});

//进行模型的推理

inferenceInterface.runInference(new String[]{OUTPUT_NODE});

//获取图片属于各个分类的概率，存放在outputs数组中。

float[] outputs = new float[NUM_CLASSES]; //用于存储模型的输出数据

inferenceInterface.readNodeFloat(OUTPUT_NODE, outputs); //获取输出数据

本文源码

参考文档

weixin_39936403

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 安卓app按钮数字识别_基于TensorFlow的MNIST手写数字识别与Android移植

本文基于TensorFlow实现了MNIST手写数字识别，并将训练好的模型移植到了Android上。环境配置TensorFlow 1.0.1Python2.7Android Studio 2.2主要步骤生成pb文件：使用TensorFlow Python API 构建并训练网络，最后将训练后的网络的拓扑结构和参数保存为pb文件。将pb文件、jar包以及so库引入Android工程中，并基于Tens...
复制链接

扫一扫