信息瓶颈理论-基础与应用

最新推荐文章于 2024-08-20 21:42:41 发布

白楚

最新推荐文章于 2024-08-20 21:42:41 发布

阅读量8.9k

点赞数 19

分类专栏：机器学习阅读笔记文章标签：信息瓶颈信息论人工智能机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zb14zb14/article/details/89792285

版权

历史沿革与导读

早在2000年，Naftali Tishby就在“The information bottleneck method”一文[1]中提出了信息瓶颈理论，给出了优化问题的数学定义和迭代算法，并且证明了算法的收敛性。
最近深度学习的热潮，也带来了对其可解释性和理论分析的关注。在2015年[2]和2017年[3]的文中，Tishby和他的学生们尝试用信息瓶颈理论用于解释深度学习，发现深度学习训练过程的“特征拟合”和“特征压缩”两个阶段，并且作了可视化分析，也在解释深度学习的细分领域发掘了一个新热点。
2018年，有研究者质疑了上述发现[4]，认为深度学习训练过程未必会有上述两个阶段，也和Tishby在公开平台上进行了讨论，从而又有公众号发文提出对“信息瓶颈理论”的批判性分析。
通过分析若干相关论文，笔者初步总结如下：

信息瓶颈理论是对数据压缩的率失真理论的拓展，这一工作早在2000年完成，并且有严格的形式化分析和证明，其理论本身的严谨性不存在质疑。
信息瓶颈理论运用于深度学习的解释，不论是否发现“特征拟合”和“特征压缩”两个阶段，都是有益的尝试和有应用价值的，学术泡沫是大家后续吹出来的。
信息瓶颈理论的实用化问题集中在训练过程的互信息估计。这个问题在信息论领域早已有若干基础，也有文献已经把相关基础整合到深度学习领域。
下面，笔者将简要介绍信息瓶颈理论的基础、在解释深度学习训练中的应用、以及在理论实用化等三个方面内容。

信息瓶颈理论：基础与概述

有部分公众号关注了信息瓶颈理论较新的应用，特别是对深度神经网络机理的解释，因此又回溯到了2000年的那篇论文[1]。例如，从

最低0.47元/天解锁文章

关注

19
点赞
踩
63

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

白楚 CSDN认证博客专家 CSDN认证企业博客

码龄17年

21: 原创

31万+: 周排名

173万+: 总排名

3万+: 访问

: 等级

626: 积分

35: 粉丝

37: 获赞

9: 评论

110: 收藏

私信

关注

热门文章

分类专栏

最新评论

An Unified Intelligence-Communication Model for Multi-Agent System——Part I
weixin_39802293 回复白楚: 搜噶
An Unified Intelligence-Communication Model for Multi-Agent System——Part I
白楚: (生命)系统的目的，是尽可能地获取最多的(可能是有功能性的)信息，并将这些信息在所处时空传递下去，物质和能量是系统获取和传递信息所需的资源。系统的智能可由这两方面能力界定。注： 1. 在主序形态解构后(如死亡)，系统一般来说会失去信息获取能力，但其曾经获取和处理后信息的传递可能存续很久。 2. 生命系统利用了时间维度来有效延续和增强信息获取和传递能力，如繁衍和变异。因此，可将多代主序结构的生命系统看作时空的连续统，其时空延续性和信息传递范畴大幅拓展。因此，人类还没有经历真正意义的死亡。
《隐秩序》-第二章：适应性主体——摘录与评述（Part-3 规则发现算法）
白楚回复 qq_43352954: 最近思考了下，觉得霍兰这本后几章关于回声模型的深入意义不大，建议看Holland 2014年写的Signals and Boundaries。另外，我最近主要投入精力在写智能-通信统一模型，https://uicm-mas.github.io/
中国人工智能大会报告现场速记-基本情况(一)
白楚回复 machine-lv: 谢谢你的留言。我主要工作方向不是AI，也只是AI界的小虾米，最近在写通信智能统一模型的开源论文，你可以参考和引用【详见https://uicm-mas.github.io/，很快会审定发布arxiv版本】。另外，我的学术主页是https://www.researchgate.net/profile/Bo_Zhang51，有我较完整的论文列表，如有相关论文感兴趣，可以直接下载。
中国人工智能大会报告现场速记-基本情况(一)
machine-lv: 老师，您好，很有幸看到您的博客。我是华南师范大学的一个水硕。我现在做AI这一块，看了您的博客，对您的研究领域很感兴趣，我现在学习也要拓展这一块。我想看一下您的相关研究论文，您可以发一篇到我邮箱吗》782934412@qq.com；非常感谢

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。