机器学习
Glen_Zou
这个作者很懒,什么都没留下…
展开
-
【学习笔记】K-means++算法
学习K-means++算法前,需要先学习K-means算法,可以参考这篇博客看得懂的K-means既然了解了K-means算法,那么我们来对比下K-means++有什么变化。首先K-means最大的问题就是对初始点选择特别敏感,那么我们就一个一个选,而不是K个一起选。K-means++步骤与K-means类似:从输入的数据集中随机选取一个点作为第一个中心点;对每一个点分别计算到已选取的中心点的距离;按照轮盘法选择一个新的点作为新的中心点,选取的原则是:距离较大的点,有较大的概率被选取;重复原创 2020-05-11 16:23:19 · 2195 阅读 · 0 评论 -
【学习笔记】逻辑回归
逻辑回归不是回归由线性回归所知,回归主要处理连续型变量。而逻辑回归处理类别型变量,因此用于分类问题,就是用回归的办法来做分类。举例我们可以利用一个人饮食、睡眠等因素,预测这个人肿瘤的大小(回归问题),然后利用肿瘤大小阈值判定恶性还是良性(分类问题)我们先利用简单线性回归的思路,利用肿瘤大小,预测这个肿瘤是良性还是恶性。由上图所示,x轴为肿瘤大小,0代表良性肿瘤,1代表恶性肿瘤。红×代...原创 2020-04-12 16:58:19 · 202 阅读 · 0 评论 -
【学习笔记】线性回归
统计量:集中趋势衡量:均值、中位数、众数离散趋势衡量:方差、标准差回归(regression) :Y变量为连续数值型(continuous numerical variable),如:房价,人数,降雨量分类(Classification): Y变量为类别型(categorical variable),如:颜色类别,电脑品牌,有无信誉简单线性回归(Simple Linear Regre...原创 2020-04-11 15:31:11 · 2299 阅读 · 0 评论 -
【学习笔记】KNN(最近邻)
综述1.1 Cover和Hart在1968年提出了最初的邻近算法1.2 分类(classification)算法1.3 输入基于实例的学习(instance-based learning), 懒惰学习(lazy learning)即临时抱佛脚,不提前训练好模型1.4 为了判断未知实例的类别,以所有已知类别的实例作为参照算法步骤:选择参数K计算未知实例与所有已知实例的距离选择最近K...原创 2020-03-05 11:15:50 · 180 阅读 · 0 评论 -
【学习笔记】决策树
什么是决策树/判定树(decision tree)?决策树是一个类似于流程图的树结构:其中,每个内部结点表示在一个属性上的测试,每个分支代表一个属性输出,而每个树叶结点代表类或类分布。树的最顶层是根结点。是分类方法中的一种算法构造决策树为什么age作为根节点呢?首先,了解下熵(entropy)的概念:信息和抽象,如何度量?1948年,香农提出了 ”信息熵(entropy)“的概...原创 2020-03-04 12:46:54 · 372 阅读 · 0 评论 -
【学习笔记】看得懂的K-means算法及其实现
算法归类:聚类(clustering) 属于非监督学习 (unsupervised learning)无类别标记(class label)举例:K-means 算法:3.1 Clustering 中的经典算法,数据挖掘十大经典算法之一3.2 算法接受参数 k ;然后将事先输入的n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类...原创 2020-02-08 22:40:29 · 1431 阅读 · 0 评论