机器学习实战
chaung船长
这个作者很懒,什么都没留下…
展开
-
机器学习实战——K-means聚类图像分割
K-Means聚类是最常用的聚类算法,最初起源于信号处理,其目标是将数据点划分为K个类簇,找到每个簇的中心并使其度量最小化。该算法的最大优点是简单、便于理解,运算速度较快,缺点是只能应用于连续型数据,并且要在聚类前指定聚集的类簇数。下面是K-Means聚类算法的分析流程,步骤如下:第一步,确定K值,即将数据集聚集成K个类簇或小组。第二步,从数据集中随机选择K个数据点作为质心(Centroid...原创 2020-03-07 18:23:56 · 1726 阅读 · 2 评论 -
机器学习实战——PCA实现图像压缩
1.主成分分析概述主成分分析是最为简单粗暴的一种数据降维方式,顾名思义就是找到数据中最为主要的方面,用这些方面来替代原始数据。具体来说,假设我们有一个具有n维特征的数据集,共有m个样本点,我们希望将这m个样本的特征维度从n维降到b维,希望b维数据尽可能的替代原始数据集。其中最为重要的因素就是如何保证减少维度后数据损失尽可能的小如下图所示,我们试图将二维数据降到一维,图中列出两个维度PC1和P...原创 2020-03-11 16:17:11 · 3556 阅读 · 4 评论