人工智能之高清监控视频存储新技术

本文将和大家分享如何利用深度学习算法实现高清监控视频无损压缩。
传输和存储能力无力支撑高清视频数据增长的现实
随着5G技术的成熟,以及高清监控设备的普及,视频数据暴增的时代已经来临。同时,面对着如VR、4K、8K等新兴视频技术的发展,网络带宽和传输能力无法支撑视频数据增长的矛盾日渐显露。
当前主流高清视频压缩技术
目前国内外针对视频实时传输主要采用前端压缩-传输,后端解码的方式。国际上通用的视频编码标准主要有运动图像专家组(MPEG)和国际电信联盟(ITU)合作开发的H.264和H.265,以及美国谷歌公司开发的VP8,VP9等。这些通用视频编码标准基于“预测-变换-量化-编码”的流程,将视频图像划分成大小一致或大小不等的编码单元,在单元内进行帧内和帧间预测,即为每一个编码单元寻找像素排列最接近的预设模式;利用预测模式和实际图像求残差,对残差矩阵进行DCT变换;在变换域对数据进行量化,以减少数据量;最后使用熵编码进一步去除数据冗余,达到对视频数据的高效压缩。H.264可以将视频元数据压缩到1/100-1/10;而H.265在同等画质条件下比H.264压缩效率提高一倍,但编码复杂性大幅提高,编码速度降低。
如何利用深度学习算法优化现有高清视频压缩技术
混合编码(Hybrid Coding)框架是目前广泛使用的视频编码框架,混合编码框架是指将预测编码,变换编码等多个类型的编码方法应用在同一个框架内的编码方法,流程主要分为预测、变换、量化、熵编码四个步骤,其中预测主要分为帧内预测和帧间预测。
在这里插入图片描述
图1. 基于块的混合编码框架示意图
我公司首创BBW视频编码技术,对经典混合编码进行了扩展,通过融合先进的机器学习与深度学习技术,在预测(帧内、帧间)、变换、量化等方面做出了独特而重要的改进,融合基于体验质量(QoE)和客观质量同步优化的思想,实现了编码后视频在码率不变的情况下画质大幅提升或画质不变的情况下显著降低码率的成果。
1. 基于感知的精细编码
基于人对视频画面的感知,有选择的调节不同区域划分块的方式。例如目标区域内的图像强制划分到8×8、4×4的精细单元,建立精细的预测模式,使用更多的码字来描述这些图像区域,以实现更好的目标区域画质;对背景区域的图像,可以降低预测单元划分精度,例如到32×32、16×16为止,适度忽略一些背景图像的细节和更新频率,有效降低背景区域图像的码率。
对于区域划分,目前BBW实现了两种独特而又互补的方案,一种是针对通用视频的显著性物体检测,另一种是针对特定场景的图像语义分割。这两种方案的特点在于:显著性物体检测是根据人对画面的关注度进行建模,能够实现在减少非显著性区域码率的情况下尽可能低的减少对画质的影响;而语义分割则能够实现对画面中不同场景的标记,动态调节编码参数,如行人、人脸、车辆、指示标志等。
在这里插入图片描述
在这里插入图片描述
图2. 显著性区域检测
这两种方案均采用优化的UNet结构UNetLite,使用BMI积累的大量场景化数据进行训练。优化后的网络具有更高的吞吐量和更低的延迟,在块划分的应用中对于精度和速度达到了平衡。
在这里插入图片描述
图3. 原始UNet结构图
同时,BBW没有使用传统的环路滤波器结构,而是直接在重建图像的环节后应用深度补偿网络(Deep Offset Net)。这一问题直接从原始YUV图像经过BBW压缩,可以获得无限量的数据。最终在BMI训练平台上,使用千万级不同场景的图像进行训练,使模型学习到有损图像到高清图像的映射。
2.智能编码
BBW编码利用深度卷积神经网络(convolutional neural network,CNN)优化快速帧内模式选择。用CNN设计若干个35类的分类器,分别对尺度为64,32,16,8,4的预测单元进行模式快速分类,输入为像素块,输出为35种预测模式中的一种。使用海量监控视频中提取出的预测单元和对应的预测模式进行训练。在编码流程中应用,首先根据预测单元的大小选择对应的分类器;然后将该预测单元的像素输入网络,输出35种模式中的一种,作为当前预测单元的帧内预测模式。使用深度学习确定帧内预测模式,相比通用HEVC的方案,耗时降低90%,大幅度提高了帧内预测的速度。
此外,BBW的“快速帧内预测模式选择方法”采用在线学习的方式,间隔固定的时间(一般是5秒),使用通用的帧内预测方法对网络结构和参数进行修正,以降低累积预测误差,并适应编码视频环境的不断变化。
3.智能量化
在视频编码流程的步骤中,量化是唯一损失数据精度、引入误差的步骤。量化参数(QP)越小,精度损失越低,保留的图像细节越丰富;QP越大,精度损失越高,保留的图像细节越少。通用视频编码H.265/HEVC对整张图像采用统一的QP值,或自适应变化的动态QP值。BBW技术应用UNetLite对画面进行划分,在目标区域采用较小的QP值,尽可能多地保留目标区域图像细节;而在背景区域采用较大的QP值,实现对视频整体码率的高效压缩。
4.模型优化
与深度学习在其他领域的应用相同,其作为BBW的重要技术支撑,也同样消耗大量的计算资源。为了能够令BBW能够落地应用,司马大大在软硬件结合优化深度学习模型推理方面进行了深入的研发。目前已积累了大量模型推理优化技术,并成功将其集成进VDMS系统中。软件方面包括知识蒸馏(Knowledge Distillation)、模型剪枝(Model Pruning)、模型量化(Model Quantization)等等,同时也在进一步探索神经网络结构搜索(NAS)在视频编码方向的应用。硬件方面,VDMS可以部署在机柜式服务器、PC台式机、嵌入式设备上,充分应用CPU、GPU、FPGA等计算设备的性能,保证了BBW技术的顺利落地。
在这里插入图片描述
图4. 知识蒸馏训练流程
BBW实现高清视频无损压缩的编码优势
●基于人工智能方法,实现智能动态编码,应用场景广泛。
●基于通用框架扩展,兼容性高,不影响结构化分析。
●压缩方式基于QoE优化,大幅压缩视频数据,对人眼来讲是无损压缩。
●相对于传统压缩方式,不改变分辨率、时长、帧率。
●PSNR值不低于32dB,满足客观和主观画质要求。
实际应用拓扑
在这里插入图片描述
(方案拓扑:后端压缩)
在这里插入图片描述
(方案拓扑:前端压缩)
BBW实现高清视频无损压缩的应用优势
我们以1万路1080P高清视频存储90天为例,与传统存储方案进行对比,可以发现本BBW实现高清视频无损压缩具备以下应用优势:
●节省90%的存储硬盘数量
●节省85%的综合用电量。
●节省75%的机柜和机房占用面积。
●节省90%的硬盘后期维护量。
同时,从后期使用和维护费用来看,使用本产品,5年总计可节省约1000万元以上。
在这里插入图片描述

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
1.3.建设意义 实现工程管理关系人与工程施工现场的整合,提高交互的明确性、效率、灵活 性和响应速度,在实现绿色建造、引领信息技术应用、提升社会综合竞争力等方面具有重要意义。 2.应用技术 智慧工地将更多人工智慧、传感技术、虚拟现实等高科技技术植入到建筑、机 械、人员穿戴设施、场地进出关口等各类物体中并且被普遍互联而形成“物联网”, 再与“互联网”整合在一起。 (1)可视化技术 能够把数据,包括测量获得的数值、现场采集的图像或是计算中涉及、产生的数字信息变为直观的、以图形图像图表信息表示的、随时间和空间变化的物理现象或物理量呈现在管理者面前,使他们能够观察、模拟和计算。 (2)物联网技术 是新一代信息技术的重要组成部分,是物物相连的互联网。物联网通过智能感知、识别技术与普适计算、广泛应用于网络的融合中。 (3)云计算技术 通过网络把多个成本相对较低的计算实体,整合成一个具有强大计算能力的完美系统,并把这些强大的计算能力分布到终端用户手中。 (4)信息管理平台技术 信息管理平台技术的主要目的是整合现有管理信息系统,以便让工程建设各参与方都可以在一个统一的平台上协同工作。 (5)数据库技术 数据库技术解决了计算机信息处理过程中大量数据有效地组织和存储的问题,减少数据存储冗余、实现数据共享、保障数据安全以及高效地检索数据和处理数据。 3.整体方案设计 智慧工地系统平台利用移动互联、物联网、云计算、大数据等先进技术,根据住建部工地管理相关标准,结合施工现场实际情况,发挥“互联网+工程管理”一体化创新技术优势,整合工地信息化资源,为施工企业、工程项目管理、工程质量安全管理提供信息化管理支撑。
### 回答1: 人工智能视频技术发展的理论依据主要包括以下几方面: 1. 计算机视觉: 计算机视觉是指人工智能在处理图像和视频数据时使用的技术。它主要依靠机器学习模型来识别图像中的特征并进行分类。 2. 自然语言处理: 自然语言处理是指人工智能系统处理自然语言文本的能力。在视频领域中,这种技术可以用于识别视频中的语音、转化文本为语音、生成字幕等。 3. 多媒体信息检索: 多媒体信息检索是指人工智能系统在大量多媒体数据中检索信息的能力。在视频领域中,这种技术可以用于根据关键字检索视频、按照主题分类视频等。 4. 智能内容生成: 智能内容生成是指人工智能系统能够根据提供的信息自动生成新的内容的能力。在视频领域中,这种技术可以用于生成视频标题、生成视频描述、生成视频字幕等。 5. 视频压缩和传输: 视频压缩和传输是指在传输和存储 ### 回答2: 人工智能视频技术的发展理论依据主要包括以下几个方面: 首先,人工智能视频技术的发展受到计算机科学和人工智能领域的支持。随着计算机技术和处理能力的不断提高,以及机器学习和深度学习人工智能算法的不断发展,人工智能视频技术得以实现。通过人工智能算法的应用和优化,可以从视频中提取出丰富的信息,实现自动识别、分类、分析和理解等功能。 其次,人工智能视频技术的发展依赖于大数据的支持。大数据的兴起为人工智能视频技术的发展提供了海量的训练数据和实践数据,这些数据对于训练和优化人工智能模型至关重要。通过对大量的视频数据进行分析和挖掘,可以构建更加准确和智能的人工智能视频系统。 此外,人工智能视频技术的发展还受到传感器技术和计算机视觉技术的支持。随着计算机视觉技术的快速发展,例如目标检测、目标跟踪、行为分析等技术的不断成熟,使得人工智能视频技术能够更好地实现对视频内容的理解和解析。同时,传感器技术的进步也使得摄像头和其他环境感知设备能够更加准确地采集视频数据,为人工智能视频技术的发展提供了更好的数据源。 综上所述,人工智能视频技术的发展理论依据主要包括计算机科学和人工智能领域的支持、大数据的应用、传感器技术和计算机视觉技术的进展等。随着人工智能技术的不断发展和创新,人工智能视频技术将在安防监控、智能交通、智能家居等领域发挥越来越重要的作用。 ### 回答3: 人工智能视频技术的发展理论依据主要基于计算机视觉、机器学习和深度学习等相关原理。 首先,计算机视觉是人工智能视频技术的基础。计算机视觉是一门研究如何使计算机“看”的技术领域,它通过采集和处理图像和视频数据,实现对图像和视频内容的理解和识别。计算机视觉的发展为人工智能视频技术提供了关键的实现手段和基础算法。 其次,机器学习是人工智能视频技术的重要支撑。机器学习是指计算机通过从大量的数据中学习,并得到新知识和经验的一种方法。通过机器学习,计算机在观看和分析大量视频数据的过程中,可以自动提取特征,识别模式并进行分类。通过机器学习算法的迭代和优化,人工智能视频技术可以不断改善和优化自身的性能。 最后,深度学习人工智能视频技术的核心。深度学习是机器学习算法的一种重要分支,其基于人工神经网络的结构和算法,通过对复杂问题进行多层次的非线性变换和抽象,在大规模数据集上实现有效的训练和学习。在人工智能视频技术中,通过深度学习算法,计算机可以模拟人类视觉系统的工作原理,实现对视频内容的高层次理解和分析,如目标检测、动作识别、场景理解等。 综上所述,人工智能视频技术的发展理论基于计算机视觉、机器学习和深度学习等相关原理。这些理论为人工智能视频技术的研究和应用奠定了基础,使计算机能够模拟人类的视觉能力,实现对视频内容的理解、分析和应用。随着相关技术的不断进步和创新,人工智能视频技术将在安全监控、智能交通、智能家居等领域发挥越来越重要的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值