基于邻域组合熵的属性约简算法.PDF
第35卷第12期 计算机应用与软件 Vol35No.12
2018年12月 ComputerApplicationsandSoftware Dec.2018
基于邻域组合熵的属性约简算法
王 光 琼
(四川文理学院智能制造学院 四川达州635006)
(达州智能制造产业技术研究院 四川达州635006)
摘 要 为了对符号性和数值型属性共存的邻域信息系统进行属性约简,从信息论的视角出发,定义邻域信息
系统中的邻域条件熵。同时考虑知识不确定性和集合不确定性对属性重要度度量的影响,结合邻域条件熵和邻
域近似精度,定义一种新的属性重要度度量———邻域组合熵。给出邻域组合熵的相关定理,提出基于邻域组合熵
的属性约简算法。在UCI数据集上的实验表明,该算法能够获得约简集较小而分类精度较高的约简结果。
关键词 属性约简 组合熵 邻域信息系统 不确定性 属性重要度
中图分类号 TP18 文献标识码 A DOI:10.3969/j.issn.1000386x.2018.12.050
ATTRIBUTEREDUCTIONALGORITHMBASEDON
NEIGHBORHOODCOMBINATORIALENTROPY
WangGuangqiong
(SchoolofIntelligentManufacturing,SichuanUniversityofArtsandScience,Dazhou635006,Sichuang,China)
(DazhouIndustrialTechnologyInstituteofIntelligentManufacturing,Dazhou635006,Sichuan,China)
Abstract Inordertoreducetheattributeoftheneighborhoodinformationsystemwiththecoexistenceofsymbolicand
numericattributes,theneighborhoodconditionalentropyintheneighborhoodinformationsystemwasdefinedfromthe
perspectiveofinformationtheory.Wealsoconsideredtheinfluenceofknowledgeuncertaintyandsetuncertaintyonthe
measureofattributeimportance.Combiningtheneighborhoodconditionalentropywithneighborhoodapproximation
accuracy,wedefinedanewattributeimportancemeasure,neighborhoodcombinationentropy.Thecorrelationtheoremof
neighborhoodcombinatorialentropywasgiven,andanattributereductionalgorithmwasproposedbasedonneighborhood
combinatorialentropy.TheexperimentonUCIdatasetshowsthatthealgorithmcangetthereductionresultwithsmaller
reductionsetandhigherclassificationaccuracy.
Keywords Attributereduction Combinatorialentropy Neighborhoodinformationsystem Uncertainty
Attributeimportance
接处理属性值有数值型数据的信息系统,为了解决此