自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 组队学习——聚类分析

聚类就是将数据集中的样本划分成多个子集,每个子集之间是不相交的,每个子集也称为“簇”。每个簇可能代表着一些潜在的含义,这些含义通常由使用者自己定义。如有一个关于洪水的数据集,要将这份洪水数据集划分成三类:高风险洪水、中风险洪水、低风险洪水。这就需要对该数据集进行聚类,将数据集聚类成三类,也就是将数据集分成三个“簇”,根据实际情况将这三簇分为高、中、低风险。总而言之针对不同的问题应该选用不同聚类方法,在选择使用哪种聚类方法时应该考虑几个方面:数据集的大小、数据的维度、问题的类型等方面。

2024-07-17 13:32:47 897

原创 组队学习——模型评估与选择(评价指标理论)

精度(Accuracy)又可以被称作为正确率或准确率等,有很多种说法,它被定义为正确分类的样本数占总样本数的比例。过拟合意为过度拟合,当模型的学习能力太好时,模型不但学习了训练集中的普遍规律也学习了训练集中的特殊性,这就导致训练误差非常小甚至为0,但是模型的泛化性能会减小,也就是说模型在测试集或预测数据上的预测效果会减弱,这就是过拟合。欠拟合就是拟合效果差,模型未学完训练集中的所有普遍规律,只学习了一部分普遍规律,这也会导致模型的泛化性能差。

2024-07-14 23:53:30 370

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除