负熵(看了好久,竟然这么简单,哎!…

本文介绍了熵的基本概念,作为衡量体系混乱程度的指标,在数据分析中有着广泛应用。讨论了概率与信息的关系,指出事件发生的概率越小,带来的信息量越大。同时,阐述了独立事件信息量的叠加原理,并通过严格减函数引理推导出信息量的表示。最后,定义了完备事件组的熵,并证明了当所有事件概率相等时熵达到最大,即不确定性最大。
摘要由CSDN通过智能技术生成
今天看数据挖掘建立判定树的部分,被熵折磨得很痛苦,看了这篇博客稍微懂了一些,数学不好还是码农的孩纸桑不起啊!文章转载自 chl033http://blog.csdn.net/chl033/article/details/4795154

         首先明确一下熵的概念,虽然它是一个热力学度量,但是现在已经广泛应用在了数据分析的方方面面。

熵(ectropy)指的是体系的混乱程度,是体系的转台函数,其值与达到状态的过程无关(所以才可以用来预测啊),下面是正经的了

【概率与信息】

         事件A的概率P(A)A发生可能性的大小的度量。

         P(A)越大,则A发生带来的信息越少;反之,P(A)越小,则A

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值