摘要:
1、首先,建立层次结构的模糊粗糙集模型,计算具有层次结构的类的上下近似。该模型与现有技术的区别在于分层的类结构。
2、定义分层特征选择问题。
3、提出一种基于兄弟节点的特征选择算法。
与平面特征选择算法相比,该算法的计算量从98.0% 24减少到6.5%,在SAIAPR数据集上的分类性能也有所提高,相关实验也验证了该分层算法的有效性。
正文简述:
本文提出了一种用于层次分类的模糊粗糙集模型,并提出了相应的特征选择算法。
- 首先,我们将层次结构嵌入到模糊粗糙集中,并使用包含策略和兄弟策略重新定义层次分类的上下近似。讨论了用于层次分类的模糊粗糙集的性质。
- 其次,讨论了分层特征选择的特征评价和特征搜索策略。在分层分类中,我们可以利用预定义的类层次结构来减少最近样本的搜索范围。
- 最后,针对分层特征选择问题设计了一种特征选择算法。使用兄弟节点来计算最近的样本,从而得到一个高效的算法设计。此外,还考虑了一些重采样策略来加快算法的速度。
采用支持向量机(SVM)、k近邻(KNN)、朴素贝叶斯(NB)分类器和三种层次测度来测试扁平特征选择和层次特征选择的性能。
文章结构:
一、对模糊粗糙集作了一些初步的研究
粗糙集和粗糙集的表示法:
I = <U, C, D>是一个决策系统,U是有限对象的非空集合,C是条件属性集合,D是决策属性集合。对任意 a ∈ C ∪ D, : U →
.
是属性a的取值,
是属性a的信息函数。
等价类:IND(R) = {
(x, y) ∈ U × U |∀ a ∈ R, a(x) = a(y)},包含x的等价类记为
上下近似:对任意X ⊆ U,有