![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习笔记
机器学习西瓜书相关笔记
cttMiao
这个作者很懒,什么都没留下…
展开
-
《统计学习方法》第三章 k近邻法
第3章 k近邻法k近邻是一种基本分类与回归方法。k近邻法的输入为实例的特征向量面对英语特征空间的点;输出为实例的类别,可以取多类。k近邻法假设给定一个训练数据集,其中实例类别已定。分类时,对新的实例,根据其k个最近邻的训练示例的类别,通过多数表决等方式进行预测。因此,k近邻法不具有显式的学习过程。k近邻法实际上利用训练数据集对特征空间进行划分,并作为其分类的“模型”。k值的选择、距离度量及分类决...原创 2020-03-17 09:11:22 · 303 阅读 · 0 评论 -
机器学习第十三章半监督学习
半监督学习13.1 未标记样本在实际生活中,常常会出现一部分样本有标记和较多样本无标记的情形。如何利用未标记样本数据呢?主动学习:从未标记样本中挑选不确定性高或分类置信度低的样本来咨询专家进行打标。最后使用扩充后的训练集重新训练学习器,这样便能大幅度降低标记成本,这便是主动学习,其目标是使用尽量少的,有价值的查询来获得更好的性能。显然,主动学习需要与外界进行交互,其本质仍然属于一种监督学...原创 2019-11-07 15:33:36 · 873 阅读 · 0 评论 -
机器学习第11章 特征选择与稀疏学习
第十一章 特征选择与稀疏学习11.1 子集搜索与评价 对当前学习任务有用的属性称为“相关特征 ”、没什么用的属性称为“无关特征”。从给定的特征集合中选择出相关特征子集的过程,称为“特征选择”。 特征选择是一个重要的“数据预处理”过程,获取数据之后通常先进行特征选择,此后在训练学习器。 为什么要进行特征选择?原因:①为了解决属性过多导致的维数灾难问题;②去除不相关的特...原创 2019-10-24 11:19:22 · 421 阅读 · 0 评论 -
《机器学习》西瓜书第九章聚类(二)原型聚类、密度聚类、层次聚类
下面几个小节分别介绍了几种聚类算法9.4 原型聚类原型聚类亦称“基于原型的聚类”,此类算法假设聚类结构能够通过一组原型刻画,在现实聚类任务中极为常见。通常情况下,算法先对原型进行初始化,然后对原型进行迭代更新求解。9.4.1 k均值算法在这个算法中,我们把所有项分为k个簇,使得相同簇中所有项彼此尽量相似,而不同簇之间彼此尽量不相似。给定样本集D={x1,x2,…,xm},k均值算法针对聚...原创 2019-10-16 09:37:31 · 642 阅读 · 0 评论