机器学习——从原理到实践
文章平均质量分 95
常见的机器学习与数据挖掘算法的原理及Python实现。专栏图片来自scikit-learn官网,如有侵权,请联系专栏作者进行删除。
nudt_oys
An AC a day,keeps WA away~
展开
-
AdaBoost算法原理及实现
AdaBoost算法输入:训练数据集T={(x1,y1),(x2,y2),…,(xN,yN)}T={(x1,y1),(x2,y2),…,(xN,yN)}T=\{(x_1,y_1),(x_2,y_2),\dots,(x_N,y_N)\},其中xi∈X⊆Rnxi∈X⊆Rnx_i\in \mathcal{X} \subseteq \mathbb{R}^n,yi∈{−1,+1}yi∈{−1,+1}y_...原创 2018-07-14 17:57:42 · 1510 阅读 · 0 评论 -
K-Means算法及Python实现
聚类是一种无监督学习,它将相似的对象划分到同一个簇中。通过这样的划分,每个簇可能对应一些潜在的类别。例如,西瓜可以被划分为“深色瓜”、“浅色瓜”、“有籽瓜”和“无籽瓜”等,这些概念对于聚类算法而言事先是未知的。基于不同的学习策略,人们设计出很多类型的聚类算法,下面我们主要介绍K-Means聚类算法并使用Python实现它。相似度计算前面提到,聚类算法视图将相似的对象归为同一簇,不相似的...原创 2018-06-17 16:54:33 · 613 阅读 · 0 评论 -
决策树构建之ID3算法
决策树是一种可以对数据集进行分类的树,它要求数据集中每个属性的可能取值都是离散的。决策树中包含3种结点: 根结点,它没有入边,只有零条或多条出边。 内部结点,它有一条入边和两条或多条出边。 叶结点,有一条入边,但没有出边。 在决策树中,每个叶结点都包含一个类标号。换句话说,每个叶节点都是已经被分好的类。根结点和内部结点表示在原创 2017-03-24 13:14:57 · 2033 阅读 · 0 评论 -
kNN分类算法
kNN(k-Nearest Neighbor,简称kNN)算法是一种常用的分类于回归方法。它的工作机制非常简单:给定测试样本,基于某种距离度量找出训练集中与其最相近的k个训练样本,然后基于这k个“邻居”的信息来进行预测。通常采用“多数表决”的决策规则对输入的测试样本进行分类,即选择k个最近样本中出现次数最多的类别标记作为预测结果,类似于我们常说的“近朱者赤,近墨者黑”;在回归任务中可以使用“平均法”原创 2017-08-24 21:26:22 · 5293 阅读 · 0 评论 -
Logistic Regression原理及Python实现
1. 问题引入相信大家都接触过分类问题,尤其是二元分类。例如现在有一些患者(训练集)的身体情况以及是否患有心脏病的数据,要求我们根据这些数据来预测其他患者(测试集)是否患有心脏病。这是比较简单的一个二元分类问题,使用线性分类器或许会取得不错的效果。但在实际生活中,我们感兴趣的往往不是其他患者是否会犯病,而是他犯心脏病的概率是多少。很直观的想法是收集患者犯病的概率,然后利用回归模型进行概率预测。但是我原创 2018-01-03 21:12:05 · 1086 阅读 · 0 评论