机器学习框架(1)----MediaPipe

1、MediaPipe  Google 多媒体机器学习框架

            https://google.github.io/mediapipe/

   

   MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。基于图形的跨平台框架,用于构建多模式(视频,音频和传感器)应用的机器学习管道。

MediaPipe 可在移动设备、工作站和服务器上跨平台运行,并支持移动 GPU 加速。使用 MediaPipe,可以将应用的机器学习管道构建为模块化组件的图形

在谷歌,一系列重要产品,如 、Google Lens、ARCore、Google Home 以及 ,都已深度整合了 MediaPipe

还支持 TensorFlow 和 TF Lite 的推理引擎(Inference Engine),任何 TensorFlow 和 TF Lite 的模型都可以在 MediaPipe 上使用。同时,在移动端和嵌入式平台,MediaPipe 也支持设备本身的 GPU 加速。

 

         MediaPipe 的核心框架由 C++ 实现,并提供 Java 以及 Objective C 等语言的支持。MediaPipe 的主要概念包括数据包(Packet)、数据流(Stream)、计算单元(Calculator)、图(Graph)以及子图(Subgraph)。数据包是最基础的数据单位,一个数据包代表了在某一特定时间节点的数据,例如一帧图像或一小段音频信号;数据流是由按时间顺序升序排列的多个数据包组成,一个数据流的某一特定时间戳(Timestamp)只允许至多一个数据包的存在;而数据流则是在多个计算单元构成的图中流动。MediaPipe 图是有向的——数据包从数据源(Source Calculator或者 Graph Input Stream)流入图直至在汇聚结点(Sink Calculator 或者 Graph Output Stream) 离开。

 

 

安装以及使用详细讲官方文档

 

应用:

(1)基于虹膜(iris)测距

         https://ai.googleblog.com/2020/08/mediapipe-iris-real-time-iris-tracking.html

    

  • 1
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Mediapipe是一个开源的跨平台数据流媒体框架,它支持用于构建机器学习应用程序的实时信号处理,包括计算机视觉,声音识别等。 Mediapipe的代码库中包含了许多示例代码,其中包括了0-9数字识别的代码。 首先,使用Mediapipe的图构建语言定义一个图的结构。这个图的结构需要包含输入节点和输出节点以及中间处理节点。在这里,我们需要一个节点来接收视频流的数据,并将这些数据传递给模型进行处理。 然后,使用Mediapipe的计算图构造器来连接这些节点。通过将节点按照正确的顺序进行连接,确保数据能够在图中正确地流动。 接下来,我们需要定义一个模型来对0-9的数字进行识别。可以使用已经训练好的模型,也可以自己训练一个模型。在这个模型中,我们需要通过输入节点接收视频流的数据,并通过中间节点将这些数据传递给模型进行预测。最后,通过输出节点将预测结果发送给后续处理节点。 最后,将图构造器保存为计算图文件,并使用Mediapipe的运行时进行实时的数字识别。在运行时,数据会根据图的结构流动,并在每个节点上进行处理。 通过以上步骤,我们可以使用Mediapipe实现0-9数字识别的应用程序。这个应用程序可以实时地从视频流中识别数字,并将结果进行显示或其他后续处理。Mediapipe提供了简便的API和强大的功能,使得开发者可以轻松地构建各种机器学习应用程序。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值