无监督特征选择算法综述

无监督特征选择算法

image-20210316214949121

Filter方法

只使用数据的内在属性,不使用聚类等其他辅助方法

速度快

单变量

Information based methods
  1. SUD(Sequential backward selection method for Unsupervised Data)
    • 基于距离相似度的熵值作为指标,进行相关性排序,选择特征
  2. SVD-Entropy
    • 过其奇异值来测量原始数据矩阵的熵,评估每个特征对熵的贡献,并根据它们各自的熵值对特征进行排序。
    • 三种选择最终特征子集的不同方法:简单排序、向前选择和向后消除
  3. Representation Entropy
    • 表示熵是数据集中信息压缩的一种度量
Spectral-similarity based methods

拉普拉斯评分。在拉普拉斯算子中,特征的重要性通过其方差和局部保持能力来评估,在拉普拉斯算子中,特征的重要性通过其方差和局部保持能力来评估。

  1. SPEC (SPECtrum decomposition)
  2. USFSM (Unsupervised Spectral Feature Selection Method for mixed data)

多变量

Statistical/information based methods
  1. FSFS (Feature Selection using Feature Similarity)
    • 将原始特征集划分成簇,使得同一簇中的特征高度相似,而不同簇中的特征不相似
    • 计算每个特征的k-NN特征。然后,选择具有最紧凑子集的特征,并且丢弃其k-NN最近特征
  2. RRFS (Relevance Redundancy Feature Selection),
    • 该方法分两步选择特征。在该方法中,首先,根据相关性度量对特征进行排序。然后,在第二步中,按照在前一步中生成的顺序,使用特征相似性度量来评估特征,以量化它们之间的冗余度。之后,选择冗余度最低的前p个特征。
Bio-inspired methods
  1. UFSACO (Unsupervised Feature Selection based on Ant Colony Optimization)
    • 遗传算法优先选择高信息素值和低相似性,直到达到预先指定的停止标准(迭代次数)。最后,选择那些具有最高信息素值的特征
  2. MGSACO (Microarray Gene Selection based on Ant Colony Optimiza-
    tion)
  3. RR-FSACO (Relevance-Redundancy Feature Selection based on
    ACO)
  4. UPFS (Unsupervised Probabilistic Feature Selection using ant colony optimization)
Spectral/sparse learning methods
  1. mR-SP (minimum-Redundancy SPectral feature selection)
    • 结合SPEC排序和最小冗余最优性准则的特征选择方法
  2. LLDA-RFE (Laplacian Linear Discriminant Analysis-based Recursive Feature Elimination)
    • 该方法利用对象之间的相似性,将线性判别分析(LDA)扩展到无监督情况(LLDA)。其思路是递归地删除LLDA判别向量绝对值最小的特征,以识别可能揭示样本中聚类的特征。
  3. MCFS (Multi-Cluster Feature Selection)
  4. MRSF (Minimize the feature Redundancy for Spectral Feature selection)
  5. UDFS(Unsupervised Discriminative Feature Selection algorithm)
    • 通过同时利用离散矩阵和特征相关性中包含的判别信息进行特征选择。
  6. NDFS (Nonnegative Discriminative Feature Selection)
  7. RUFS (Robust Unsupervised Feature Selection)
    • 同时实现鲁棒聚类和鲁棒特征选择。
  8. SPNFSR (Structure-Preserving Non-negative Feature Self-Representation)

Wrapper方法

使用聚类算法评估特征子集

计算量较大

Sequential methods

  1. SS-SFS(Simplified Silhouette Sequential Forward Selection)
    1. 该方法根据简化轮廓准则选择质量最好的特征子集。在该方法中,使用前向选择搜索来生成特征子集。使用k-means聚类算法对每个特征子集进行聚类,并通过simplied-silhouette准则测量的聚类质量来评价特征子集的质量

Bio-inspired methods

  1. ELSA(evolutionary local selection algorithm)
    • 一种基于k-means和高斯混合聚类算法的进化局部选择算法,来搜索特征子集和聚类数目
  2. multi-objective genetic algorithm (MOGA)

Iterative

  1. LLC-fs (Local Learning-based Clustering algorithm with feature selection)

  2. EUFS (Embedded Unsupervised Feature Selection)

    • 通过稀疏学习将特征选择直接嵌入到聚类算法中
  3. DGUFS (Dependence Guided Unsupervised Feature Selection)

Hybrid方法

综合上面两种方法,在计算速度和模型效果之间做一个折衷

  1. BFK( a hybrid UFS method non-based on ranking)
    • 该方法从包装器阶段开始,通过在用户指定的集群范围内的数据集上运行kmeans聚类算法。采用简化轮廓准则对聚类进行评价,并选取值最高的聚类。随后,在滤波阶段,利用马尔可夫方法,通过贝叶斯网络选择一个特征子集

常用用于分类和聚类的特征选择方法

image-20210317090533566

不同领域的特征选择算法应用

image-20210317090659551

  • 6
    点赞
  • 52
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
智慧校园整体解决方案是响应国家教育信息化政策,结合教育改革和技术创新的产物。该方案以物联网、大数据、人工智能和移动互联技术为基础,旨在打造一个安全、高效、互动且环保的教育环境。方案强调从数字化校园向智慧校园的转变,通过自动数据采集、智能分析和按需服务,实现校园业务的智能化管理。 方案的总体设计原则包括应用至上、分层设计和互联互通,确保系统能够满足不同用户角色的需求,并实现数据和资源的整合与共享。框架设计涵盖了校园安全、管理、教学、环境等多个方面,构建了一个全面的校园应用生态系统。这包括智慧安全系统、校园身份识别、智能排课及选课系统、智慧学习系统、精品录播教室方案等,以支持个性化学习和教学评估。 建设内容突出了智慧安全和智慧管理的重要性。智慧安全管理通过分布式录播系统和紧急预案一键启动功能,增强校园安全预警和事件响应能力。智慧管理系统则利用物联网技术,实现人员和设备的智能管理,提高校园运营效率。 智慧教学部分,方案提供了智慧学习系统和精品录播教室方案,支持专业级学习硬件和智能化网络管理,促进个性化学习和教学资源的高效利用。同时,教学质量评估中心和资源应用平台的建设,旨在提升教学评估的科学性和教育资源的共享性。 智慧环境建设则侧重于基于物联网的设备管理,通过智慧教室管理系统实现教室环境的智能控制和能效管理,打造绿色、节能的校园环境。电子班牌和校园信息发布系统的建设,将作为智慧校园的核心和入口,提供教务、一卡通、图书馆等系统的集成信息。 总体而言,智慧校园整体解决方案通过集成先进技术,不仅提升了校园的信息化水平,而且优化了教学和管理流程,为学生、教师和家长提供了更加便捷、个性化的教育体验。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值