TensorFlow on Android(6): 看起来像个机器学习专家

回顾

先来回顾一下我们为了实现一个物体识别器都做了哪些工作:

  1. 找到Pre-traind Model
  2. 找到TensorFlow的Android库
  3. 找到相应的Input Op
  4. 向Input Op 输入相应格式的数据
  5. 找到相应的Output Op
  6. 从Output Op中提取数据并解析

是不是有一种很熟悉的感觉, 这个像极了我们使用一个Jar包或者一个Ruby Gem:先下载相应的库, 然后再看文档知道API的输入参数是什么, 返回结果什么, 然后再调用它。 这个类比的确很像, 不幸的是, 大部分的模型,或者说大部分TensorFlow Models项目里面的模型,并没有这么详细的,标准的文档,有的还需要你自己去导出.pb文件。 如果你不满足于只实现一个物体识别器, 还想用一些其他的模型来解决你的问题, 那么可能你需要自己去找到Inupt/Output Op, 输入参数的格式等。 我们这里仍然以Object Detection API为例子,来看一下可以从哪些地方获取这样的信息。

准备工作##

在开始之前,我们需要安装一些工具, 这些工具也是机器学习专家经常使用的。(COOL! 我们首先学会了一些机器学习的术语, 现在又开始学习使用机器学习的工具了, 下次化妆舞会上你就可以扮演机器学习专家了,没人认得出来!)

Python: 说到机器学习, Python肯定是必不可少的,我也建议大家, 如果不会的话可以先开始学习,在后面的文章中我们会用到的。

这里可以找到详细的文档,教你在各个平台上面安装Python。

Jupyter Notebook: 这是一个交互式的文档, 可以将文本, 公式, 代码和一些可视化的内容集合到一个文档里面,在机器学习和数据处理的领域里面,你会经常用到它, 安装很简单:

pip install --upgrade pip
pip install jupyter

TensorFlow: 最终我们还是需要安装这个框架,因为我们可能需要写一点Python代码, 在后面的文章中,我们也需要用到。 可以在这里找到相关文档

安装完这3个东西以后,我们就可以正式开始了。

从代码中寻找

代码永远是最好的文档。 TensorFlow Models项目中大部分的模型都有展示如何Inference的Python代码, 读懂这些代码能获取到大量关于如何使用这个模型的信息, 之后你就可以进行其他语言的移植了。

Object Detection API提供了一个Jupyter Notebook的文档, 我们来看一下。
首先你要下载TensorFlow Models的代码

git clone https://github.com/tensorflow/models.git

然后运行Jupyter Notebook

cd models/research/object_detection
jupyter notebook

如果不发生意外的话,命令行终端上应该会打出启动成功的信息, 默认情况下会在localhost:8888上启用一个web服务,并自动打开你的浏览器跳转到相应的页面:
enter image description here

我们点击object_detection_tutorial_ipynb文件,就可以打开这个notebook了
在上面我们可以看到使用这个模型的Python示例代码:

enter image description here

如果你对Python足够熟悉的话, 可以从这些代码里面获取到相应的信息,然后可以根据这些信息再移植到其他语言。

注意这里python代码和我们的Android代码稍微有点不一样,比如

image_tensor = detection_graph.get_tensor_by_name('image_tensor:0')

Python接口里面是通过获取Op的output tensor, 然后在tensor上面操作进行数据的输入和输出,所以这里用’image_tensor:0’ 代表 ‘image_tensor’ Op的第一个output tensor, 这里Java和Python接口的形式不一样, 但是逻辑是一致的。

用TensorBoard来检视模型

TensorBoard是TensorFlow自带的一个可视化工具

如果说从代码里面获取的信息还不够的话, 我们还可以用TensorBoard来直接查看模型的结构,或者用TensorFlow的术语来说,模型的Graph

TensorBoard运行的时候会在本地启动一个Web服务器,然后将相关的数据显示在网页上,我们可以把.pb文件导入到TensorBoard里面,然后显示整个网络的结构。

也许在一个完美的世界里面,我们可以选择文件->打开->选择.pb文件,就可以看到结果了,但是在这个残酷的现实世界里,我们还需要写一点Python代码才能做到这点(已经有人在TensorFlow的项目里面提了这个Feature request, 不过就本博客编写的时候,这个功能还没有实现)

现在找到我们的.pb文件, 然后在同一目录里面创建一个load_graph.py文件, 内容为:

import tensorflow as tf
from tensorflow.python.platform import gfile
with tf.Session() as sess:
  model_filename ='FILENAME_OF_PB_FILE'
  with gfile.FastGFile(model_filename, 'rb') as f:
    graph_def = tf.GraphDef()
    graph_def.ParseFromString(f.read())
    g_in = tf.import_graph_def(graph_def)
LOGDIR='log'
train_writer = tf.summary.FileWriter(LOGDIR)
train_writer.add_graph(sess.graph)%

注意你需要将FILENAME_OF_PB_FILE替换为.pb文件的文件名,比如model.pb

然后运行

python load_graph.py

如果没有出现意外的话, 运行这段Python代码之后,会在log文件夹里面生成TensorBoard需要的文件,现在整个目录看起来是这样的
enter image description here

然后我们CD到这个目录, 运行

tensorboard --logdir ./log

然后打开

http://localhost:6006/#graphs

enter image description here

然后双击"import", 整个网络的结构就出来了
enter image description here

在这个图上我们不难找到Input和output Op
enter image description here

enter image description here

我们再观察连接这些Op的箭头上的内容,比如image_tensor上面写着 1x?x?x3, 这代表着这个输入/输出的数据的shape。在这里image_tensor输出给下一个节点的数组Shape为 (1, image_height, image_width, 3)

数组Shape的定义,你可以参考NumPy的相关文档,我们这里不做深入的讨论。 你只需要知道,这个shape和我们在java接口里面调用Feed接口的参数是一致的:

inferenceInterface.feed("image_tensor", byteInput, 1, 300, 300, 3);

一般来说,结合示例代码和网络结构图,如何使用一个模型就应该很清楚了。

一些资源##

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sufish

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值