熵理论和信息粒度是度量信息系统不确定性的两种主要方法。
背景
粒度信息的必要性
举个例子:合适的粒度常常是由问题本身及问题背景决定的, 这一点对设计基于粒计算的数据处理框架有重要意义. 举一个关于时间的例子, 例如张先生问他的朋友:“ 你什么时候回国的”, 回答这个问题所选择的时间粒度其实是由他朋友回国的时间到现在有多久决定的. 如果没超过一天, 那么他会说:“ 昨天中午”;如果有十天左右了, 他可以说:“ 上周”; 再如果是朋友回国好几年了, 张先生才得知消息, 那么“ 2009年”就可以是一个满意的答案了. 注意到上面几个答案具有不同的粒度, 分别是午、 周和年. 如果不采用合适的粒度, 统一都用计算机上常见的时间戳格式来回答, 如:“ 2013年4月29日下午3时25分”, 就不太合理, 让人觉得别扭.(因此,粒度的划分需要适应求解的问题。)
传统的数据挖掘技术总是在最细粒度的原始数据上进行分析, 而粒计算观点则认为选择与问题相适应的粒度空间有助于提高求解的质量和求解的时空效率.
信息粒度的物理意义
粒度计算由Lin于1997年在解决多层问题时首次提出,是信息处理中一种新的概念与计算范式, 模糊逻辑、 粗糙集和熵空间是其主要的三大理论。粒度计算已成为信息科学领域的研究热点之一,