百面深度学习读书笔记-视频处理_compress-then-analyze. (b) analyze-then-compress-CSDN博客

本文链接：https://blog.csdn.net/weixin_42245100/article/details/124214789

本文探讨了视频处理的各个方面，包括视频编码器中的帧内预测和环路滤波技术，以及如何在视频监控中平衡压缩与识别准确性。同时，介绍了图像质量评价标准和超分辨率重建方法，如SRCNN和RAISR，并讨论了如何通过深度学习加速和提升重建效果。此外，还涵盖了视频超分辨率重建中的帧间相关性和运动补偿技术。最后，涉及网络通信中的时间序列预测和自适应码率控制策略，如LSTM和Pensieve算法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

视频处理

视频编码器

帧内预测

- 通过当前待编码图像块的像素值来选择帧内编码模式（卷积），然后用选择的模式来预测待编码图像块的所有像素值（HEVC）。
- 通过当前待编码图像块的周边像素值，直接预测当前待编码图像块的所有像素值（多层全连接网络）。

环路滤波

- 主要解决视频重建中的块效应、振铃效应、颜色偏差等失真效应。
- 有重叠地选取比较大的重建块，利用深层卷积神经网络对重建块进行增强和还原。

视频监控

视频压缩和识别准确率的平衡

- Compress-Then-Analysis
- Analysis-Then-Compress
- 视频特征和内容联合压缩传输模型
- 人脸图像视频压缩算法
  - 人脸特征提取
    - FaceNet
      - 利用深层卷积神经网络和三元损失函数实现了从图像像素空间到人脸特征空间的映射。
  - 人脸基本结构重建
    - 主干：转置卷积神经网络
    - 损失函数：平均绝对误差（MAE）和VGG-19中的ReLU层感知误差的线性组合
  - 人脸残差信息压缩
    - 原始图像与基本层结构图的残差信息进行压缩。
      - 基于GDN变换的模型
      - 传统图像视频压缩算法
        JPEG
        JPEG2000
        HEVC

图像质量评价

主/客观质量评价

全参考/半参考/无参考质量评价

- FR-IQA
- RR-IQA
- NR-IQA

超分辨率重建

方法

- 基于插值的超分辨率重建方法
  - 速度快
  - 图像细节无法很好重建（会产生振铃或锯齿现象）
- 基于重建的超分辨率重建方法
  - 频域法
    - 消混叠重建方法
  - 空域法
    - 很强的包含空域先验约束的能力
- 基于学习的超分辨率重建方法
  - 算法
    - SRCNN
      - 图像块抽取和表示
      - 非线性映射
      - 重建
    - RAISR
  - 评价指标
    - 峰值信噪比（PSNR）
    - 结构相似性指标（SSIM）