【ELT.ZIP】OpenHarmony啃论文俱乐部——计算机视觉数据压缩应用

  • 本文出自ELT.ZIP团队,ELT<=>Elite(精英),.ZIP为压缩格式,ELT.ZIP即压缩精英。
  • 成员:
    • 上海工程技术大学大二在校生
    • 合肥师范学院大二在校生
    • 清华大学大二在校生
    • 成都信息工程大学大一在校生
    • 黑龙江大学大一在校生
    • 山东大学大三在校生
    • 华南理工大学大一在校生
  • 我们是来自7个地方的同学,我们在OpenHarmony成长计划啃论文俱乐部里,与华为、软通动力、润和软件、拓维信息、深开鸿等公司一起,学习和研究操作系统技术

【往期回顾】

 2月23日 《老子到此一游系列》之 老子为什么是老子 —— ++综述视角解读压缩编码++
 3月11日 《老子到此一游系列》之 老子带你看懂这些风景 —— ++多维探秘通用无损压缩++
 3月25日 《老子到此一游系列》之 老子见证的沧海桑田 —— ++轻翻那些永垂不朽的诗篇++
 4月4日 《老子到此一游系列》之 老子游玩了一条河 —— ++细数生活中的压缩点滴++
 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——一文穿透多媒体过往前沿++
 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——这些小风景你不应该错过++
 4月18日 ++【ELT.ZIP】OpenHarmony啃论文俱乐部——浅析稀疏表示医学图像++

【本期看点】

  • 高速缓存与压缩算法会碰撞出什么火花呢?
  • 图像、医疗、机器人、通信都在这里了
  • 你可能少有听说的TinyOS操作系统
  • 揭秘 3D 网格压缩的三类方式
  • 殿堂级 WARP 寄存器压缩技术

【技术DNA】

file

【智慧场景】

file


引言

  • 随着计算机需求的日益增长,致使计算机在各个领域都有应用,计算机视觉就是其中之一。目前传感器的功能已经非常强大,能够通过使用各种传感器来模拟人眼,以获取周边环境的信息,比如物体的形状、大小等。这些特征能够让我们运用几何学、物理学、统计学等知识构造各种模型。
  • 为了达到我们的目的,我们通常使用相机、电缆、电脑以及各种接入设备来捕获我们需要的信息。当我们与他人分享这些信息时,我们可以考虑存储空间、速率等多种因素来确定合适的压缩算法来进行信息的传播。
    file

不同种计算机视觉应用程序与压缩算法

一、图像修整应用程序

  1. 图片编辑
  • 我们需要存储或传输真实的图像以及压缩后的图像来再现真实的图像,这最终会增加带宽和存储空间。因此,我们利用 JPEG 变形算法将图像转换为压缩图像,并保护了重要的特性。
  1. 图像挖掘
  • 图像数据挖掘是用来挖掘大规模图像数据中隐含的知识、图像内或图像间的各种关系以及其他隐藏在图像数据中的各种模式的一种技术,应用于 MRI、钻石眼、脑肿瘤分析等。一般先要进行 Run length 编码,然后是 Huffman 编码算法,以相对较低的成本存储大量的数据,并从给定的图像中提取越来越多的信息。
    file
  1. 图像测序
  • 随着医学图像和基因测序技术的提高,越来越多的医学图像和测序数据被检测和存储。这些海量数据的背后隐藏了多种疾病的发病机制和有效治疗相关信息。我们需要无损压缩,因为我们不能冒序列和描述丢失的风险,因此,为了压缩这些数据,使用并行计算算法来压缩给定的数据,首先数据根据不同的模式进行分区,然后这些模式使用算术代码进行压缩。
  1. Z-Stack 图像
  • Z-Stack其实就是在Z轴方向上连续拍很多张图,然后可以做一个叠加,拍摄的间隔距离或是切片(形象的说法)是可以自己设置的,然后拍出来的从上往下看可以想象成一个长方体,然后把这个长方体像拆开盒子一样将各个面铺开,展现出来的就是下面的图片。
    file
  1. 图像信息隐写
  • 隐写术是一种将保密信息隐藏在公开信息中的技术,利用图像文件的特性,我们可以把一些想要刻意隐藏的信息或者证明身份、版权的信息隐藏在图像文件中。比如早期流行的将一些下载链接、种子文件隐藏在图片文件中进行传播,再比如某互联网公司内部论坛“月饼事件”中通过员工截图精准定位个人信息的技术,都可以归为图像隐写技术(Image Steganography)。
    file

  • 我们可以利用 GIF,因为它可以在任何硬件或软件上运行。使用 LZW- 无损技术对数据进行压缩,然后将这些数据嵌入到边缘设备中。

  1. 图像融合
  • 图像融合是指将多源信道所采集到的关于同一目标的图像数据经过图像处理和计算机技术等,最大限度的提取各自信道中的有利信息,最后综合成高质量的图像,以提高图像信息的利用率、改善计算机解译精度和可靠性、提升原始图像的空间分辨率和光谱分辨率,利于监测
    file

二、从3D到2D转换的应用程序

  1. 3D映射
  • 它利用几何最小化之后的算术编码来压缩占用非常大的 OBJ 格式的数据,需要存储和传输。采用无损压缩的方式对其进行压缩是最合适的。
  1. 地形建模
  • 地形建模的数据结构和结构的描述需要存储,需要使用 Shannon 算法对图进行无损压缩,描述使用 SZIP 压缩。它也有两个步骤:
  1. 第一步对结构进行二进制编码

  2. 第二步用算术编码器对第一步得到的编码进行压缩。我们不能承受信息的丢失,所以我们使用无损算法

  3. 人体姿势跟踪

  • 由于每天创建和观看的视频数量巨大且分辨率不断提高,视频压缩仍然是一个正在进行的研究课题。最流行的视频压缩算法,如 MPEG 和 H.26x 家族,通过计算像素块的运动来估计这些块在附近帧中的外观,文中提出了一种带有拓展剩余编码的基线视频压缩算法,该算法为 3D 姿态跟踪 + 基于 pde 的图像压缩 + 半色调的三种方法的结合,能够在背景所带来的噪声不大的情况下超过 MPEG-1与 MPEG-4,在背景噪声影响较大的情况下,优于 MPEG-1。
    file
  1. 汽车应用中基于夜视行人检测
  • 汽车应用中的行人检测主要使用 JPEG2000 和 H.264/AVC 进行压缩。我们需要在一个高流量通道上传输数据,一般通过使用 8位像素深度/颜色通道的编码器来进行有损压缩。
  1. 面部表情检测
  • “表情”是我们日常生活中提到很多的一个词语,在人际沟通中,人们通过控制自己的面部表情,可以加强沟通效果。人类的面部表情至少有21种,除了常见的高兴、吃惊、悲伤、愤怒、厌恶和恐惧6种,还有惊喜(高兴+吃惊)、悲愤(悲伤+愤怒)等15种可被区分的复合表情。
    file

  • 面部表情检测使用几何最小化和 JPEG 2000。一个面部表情中有大量的特征,所以我们需要适当的存储细节,对数据有很高的要求。

  1. 运动目标检测
  • 运动目标检测是指将图像序列或视频中发生空间位置变化的物体作为前景提出并标示的过程,它一直是一个十分热门的研究领域,广泛应用于智能监控、多媒体应用
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值