COIN 基于隐式神经表示对于压缩工作的探究

最新推荐文章于 2024-05-29 14:23:25 发布

Xxxy _

最新推荐文章于 2024-05-29 14:23:25 发布

阅读量362

点赞数 6

分类专栏： 3D点云论文学习笔记文章标签：人工智能算法 python 论文阅读论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/skyxya/article/details/137834491

版权

3D点云论文学习笔记专栏收录该内容

12 篇文章 1 订阅

订阅专栏

1. 论文基本信息

2. 创新点

提出了一种新的图像压缩的简单方法：不是存储图像的每个像素的 RGB 值，而是存储过度拟合图像的神经网络的权重。

3. 背景

压缩隐式神经表示。使用神经网络将像素位置 (x, y) 映射到 RGB 值（通常称为隐式神经表示）来过度拟合图像。然后，将这个神经网络的权重 θ 量化为较低的位宽并传输它们。

将我们的方法与学习的权重分布相结合可能会导致有前途的神经数据压缩方法
将图像视为从像素位置到 RGB 值的函数，使得网络可以通过逐渐提高分辨率来形成渐进式解码，对资源受限的设备特别有吸引力。

4. Pipeline

令 I 表示我们希望编码的图像，使得 I[x, y] 返回像素位置 (x, y) 处的 RGB 值。文中定义了一个函数 fθ : R2 → R3，其参数 θ 将像素位置映射到图像中的 RGB 值，即 fθ (x, y) = (r, g, b)。然后，我们可以通过在一些失真度量下将 fθ 过拟合到图像上来编码图像。在本文中，我们使用均方误差，得到以下优化问题：

使用标准激活函数的 MLP 参数化 fθ 会导致欠拟合，有多种办法可以解决这个问题，有可能使用大量参数来使得 MLP 能够过拟合模型、或者使用正弦激活函数对像素坐标进行编码，文中选择了一种给定参数预算产生了功能好的结果。

文中采用两种方法减少模型的大小：

架构搜索：通过调整 MLP 的层数和每层的宽度（即每层的神经元数量或参数量）来找到最优的网络架构。
权重量化：打将权重的精度从 32 位降低到 16 位，有助于减少模型的大小。

5. 💎实验成果展示

6. 🔍问题分析

6.1. 局限性：

编码速度慢：

由于需要为每个编码的图像解决优化问题，编码过程较慢。这对于大规模的一对多媒体分发，如Netflix，可能不是理想的。

解码时的计算需求：

解码时需要在每个像素位置评估网络以还原完整的图像。尽管这种计算可以通过并行处理优化，但仍可能会产生一定的计算成本。

性能：

- 与现有的最先进的压缩方法相比，该方法的性能较差。

6.2. 未来工作方向：

元学习和摊销推理：

可能可以通过元学习或摊销推理方法绕过编码速度的局限性。

权重分布学习：

学习函数权重的分布可能会为该方法带来显著的压缩收益。

神经架构优化：

通过神经架构搜索或修剪等方法优化表示图像的函数的结构。

模型压缩：

可以采用更先进的模型压缩方法，而不仅仅是简单地将权重转换为半精度。

应用于其他类型的数据：

将该方法应用于不同类型的数据，如视频或音频，可能会有趣且有潜力。

关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
COIN 基于隐式神经表示对于压缩工作的探究

提出了一种新的图像压缩的简单方法：不是存储图像的每个像素的 RGB 值，而是存储过度拟合图像的神经网络的权重。
复制链接

扫一扫

专栏目录

Xxxy _ CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

38万+: 周排名

5万+: 总排名

2万+: 访问

: 等级

449: 积分

404: 粉丝

250: 获赞

8: 评论

254: 收藏

私信

关注

热门文章

分类专栏

3D点云论文学习笔记 12篇
Java后端学习 1篇

最新评论

COIN++: Neural Compression Across Modalities 论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
COIN 基于隐式神经表示对于压缩工作的探究
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
ELIC 论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
OctField: Hierarchical Implicit Functions for 3D Modeling 论文笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
VoxelContext-Net: An Octree based Framework for Point Cloud Compression 论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Xxxy _ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。