自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

miaoyanmm的博客

JUST DO IT

  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 集成学习——组合不同的模型

集成学习(ensemble method)的目标是:将不同的分类器组合成为一个元分类器,与包含于其中的单个分类器相比,元分类器具有更好的泛化性能。多数投票原则(majority voting):将大多数分类器预测的结果作为最终类标,也就是说,将得票率超过50%的结果作为类标。多类标分类选择得票最多的类别。基于训练集,首先训练 m 个不同的成员分类器 (C1,...,Cm)(C1,......

2018-09-16 20:05:32 5637 4

原创 模型评估与参数调优

基于流水线的工作流scikit-learn 中的 Pipline 类。它使得我们可以拟合包含任意多个处理步骤的模型,并模型用于新数据的预测。案例1:威斯康星乳腺癌数据集使用Breast Cancer Wisconsin 数据集,此数据集共包含569个恶性或良性肿瘤细胞样本。数据集的前两列分别存储了样本唯一的ID以及对样本的诊断结果(M代表恶性,B代表良性)。数据集的3~32列包含了30...

2018-09-11 17:54:33 6791

原创 非线性映射——核主成分分析

许多机器学习算法都假定输入数据是线性可分的。感知器为了保证其收敛性,甚至要求训练数据是完美线性可分的。然而,在现实世界中,大多数情况下我们面对的是非线性问题,针对此类问题,通过降维技术,如PCA和LDA等,将其转化为线性问题并不是最好的办法。 核函数与核技巧通过将非线性可分问题映射到维度更高的特征空间,使其在新的特征空间上线性可分。为了将样本 x∈Rdx∈Rd{x\in R^d} 转换到...

2018-09-09 22:08:03 16974 3

原创 无监督数据降维技术——线性判别分析

线性判别分析基本原理线性判别分析(Linear Discriminant Analysis, LDA)是一种可作为特征提取的技术,它可以提高数据分析过程中的计算效率,同时,对于不适用于正则化的模型,它可以降低因维数灾难带来的过拟合。LDA的基本概念与PCA非常相似,PCA试图在数据集中找到方差最大的正交的主成分分量的轴,而LDA的目标是发现可以最优化分类的特征子空间。LDA与PCA都是可用...

2018-09-09 14:32:36 1928

原创 无监督数据降维技术——主成分分析

数据压缩技术可以帮助我们对数据进行存储和分析,特征提取通过归纳总结数据集所蕴含的信息,可以将原始数据集变换到一个维度更低的新的特征子空间,从而实现数据压缩。无监督数据降维技术——主成分分析主成分分析是一种广泛应用于不同领域的无监督线性数据转换技术,其突出作用是降维。PCA的目标是在高维数据中找到最大方差的方向,并将数据映射到一个维度不大于原始数据的新的子空间上。如果使用PCA降维,...

2018-09-09 11:58:32 1423

数据结构案例教程(C语言版)

数据结构案例教程(C语言版)_徐翠霞.pdf

2015-08-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除