Python
无语_人生
现在付出的所有努力,只为将来有机会能选择自己喜欢做的事。
展开
-
集成学习-个人笔记
集成学习通过某种策略对单个学习器进行结合,通常可获得比单一学习器显著优越的泛化性能,因此在许多学习任务当中都应用了集成学习。本文先介绍集成学习的基本理论思想,再结合scikit-learn官方文档给出常见的几种集成学习算法的Python实现。集成学习的一般结构:先产生一组“个体学习器”,再用某种策略将它们结合起来。若集成中只包含同类型的学习器,这样的集成就是“同质”的,每一单个学习器称为“基学习器...原创 2018-04-26 16:16:14 · 461 阅读 · 0 评论 -
聚类-个人笔记
聚类是无监督学习的一种,目标是对无标记训练样本的学习来解释数据的内在性质及规律,为进一步的数据分析提供基础。聚类算法涉及的两个基本问题:性能度量和距离计算性能度量的指标可分为外部指标和内部指标,外部指标主要有JC系数、FM系数、Rand指数等,而内部指标主要有DB指数、Dunn指数等,此不再详细阐述。距离度量:闵科夫斯基距离:当P=2时就是熟悉的欧氏距离;P=1时称作曼哈顿距离。这里需要注意,闵科...原创 2018-05-15 17:18:15 · 351 阅读 · 0 评论