机器学习之特征选择
文章平均质量分 79
appron
这个作者很懒,什么都没留下…
展开
-
深度学习之过拟合和欠拟合
深度学习值过拟合和欠拟合原创 2022-08-19 22:34:53 · 888 阅读 · 0 评论 -
A Detailed Investigation and Analysis of Using Machine Learning Techniques for Intrusion Detection译一
入侵检测是当今网络世界的重要安全问题之一。已经开发了大量的基于机器学习方法的技术。然而,它们在识别所有类型的入侵方面并不十分成功。在本文中,我们对各种机器学习技术进行了详细的调查和分析,以找到与各种机器学习技术在检测入侵活动方面的问题的原因。攻击分类和攻击特征的映射被提供给每个攻击对应。还讨论了与使用网络攻击数据集检测低频攻击有关的问题,并提出了可行的改进方法。机器学习技术在检测各类攻击的能力方面进行了分析和比较。还讨论了与每一类技术相关的局限性。本文还包括各种机器学习的数据挖掘工具。最后,提供了使用机器学翻译 2021-05-19 16:56:56 · 760 阅读 · 0 评论 -
半监督聚类方法
传统无监督聚类算法在划分数据时并不需要任何数据属性,但在实际应用中,存在少量带有独立类标签或成对约束的监督信息的数据样本,学者们致力于将这些为数不多的监督信息运用于聚类,以得到更优的聚类结果,从而提出 了半监督聚类。1.无监督聚类先说无监督聚类,如图 1-2 所示,现有的无监督聚类算法按照度量数据样本间相似度的方式, 以及聚类过程中数据样本之间的关系被划分为五大类,即基于划分方法的聚类、 基于层次方法的聚类、基于密度方法的聚类、基于网格方法的聚类、基于模型方 法的聚类[7]。所谓基于划分方法的聚类(原创 2021-05-13 21:09:56 · 9272 阅读 · 5 评论 -
使用类内散度与类间散度进行特征选择
1.度量类内差异,可以使用方差σ来度量,正类方差和负类方差之和通常也称为类内散度σ1+σ2。度量类间差异可以使用均值距离Δu,通常称为类间散度。这可以用作特征选择,即在分类过程中,我们希望使用类内差异小、类间差异大的特征。因此,可以对所有特征的类内散度和类间散度进行排序.如 1.1根据alpha*(σ1+σ2)+-|Δu|从小到大选择,即选择较小的值 1.2根据σ...原创 2019-11-25 22:45:06 · 3158 阅读 · 0 评论