三菱plc编程教学从入门到精通,机器学习 -- 简析聚类算法,知乎上转疯了

3. 类或族

4. 类与类之间的距离

三、K均值聚类

1. 概述

2. 模型

3. 策略

4. 算法

四、层次聚类

1. 概述

2. 算法操作步骤

五、密度聚类

1. 概述

2. DBSCAN算法

3. 算法优缺点


聚类算法

============

聚类算法是一种无监督学习

一、无监督学习


在无监督学习(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础。

****聚类:****K-means, 层次聚类,密度聚类

****降维:****PCA

无监督学习的基本想法是对给定数据(矩阵数据)进行某种****“压缩”,从而找到数据的潜在结构****。假定损失最小的压缩得到的结果就是最本质的结构。

(1)考虑发掘数据的纵向结构,把相似的样本聚到同类,即对数据进行聚类。

(2)考虑发掘数据的横向结构,把高维空间的向量转换为低维空间的向量,即对数据进行降维。

(3)同时考虑发掘数据的纵向与横向结构,假设数据由含有隐式结构的概率模型生成得到,从数据中学习该概率模型。

1. 聚类

聚类(clustering)是将样本集合中相似的样本(实例)分配到相同的类,不相似的样本分配到不同的类。

聚类时,样本通常是欧氏空间中的向量,类别不是事先给定, 而是从数据中自动发现,但类别的个数通常是事先给定的。样本之间的相似度或距离 由应用决定。

2. 降维

降维(dimensionality reduction)主要用于数据分析,也可以用于监督学习的预处理。降维可以帮助发现高维数据中的统计规律。

降维是将训练数据中的样本(实例)从高维空间转换到低维空间。假设样本原本存在于低维空间,或者近似地存在于低维空间,通过降维则可以更好地表示样本数据的结构,即更好地表示样本之间的关系。高维空间通常是高维的欧氏空间,而低维空间是低维的欧氏空间或者流形(manifold)。 从高维到低维的降维中,要保证样本中的信息损失最小

降维有线性的降维和非线性的降维。

二、聚类的基本概念


1. 聚类简介

聚类主要用于数据分析,也可以用于监督学习的预处理。聚类有助于发现数据的统计规律。聚类是针对给定的样本,依据它们特征的相似度或距离,将其归并到若干个“类”或“簇”的数据分析问题。

聚类的目的是通过得到的类或簇来发现数据的特点或对数据进行处理,在数据挖掘、模式识别等领域有着广泛的应用。

聚类属于无监督学习,因为只是根据样本的相似度或距离将其进行归类,而类或簇事先并不知道。****相关算法:****K-means clustering, Hierarchical clustering, density-based clustering

2. 样本之间的距离或相似度

假设有n个样本,每个样本由m个属性的特征向量组成,样本合集可以用矩阵X表示

聚类的核心概念是相似度(similarity) 或距离(distance),有多种相似度或距离定义。因为相似度直接影响聚类的结果,所以其选择是聚类的根本问题。

(1)闵可夫斯基距离

闵可夫斯基距离越大,相似度越小,距离越小,相似度越大。(反比关系)

(2)马哈拉诺比斯距离

马哈拉诺比斯距离(Mahalanobis distance),简称马氏距离,也是另一种常用的相似度,考虑各个分量(特征)之间的相关性并与各个分量的尺度无关。

马哈拉诺比斯距离越大****,相似度越小,距离越小相似度越大。(反比关系)****

(3)相关系数

样本之间的相似度也可以用相关系数(correlation coefficient)来表示。

相关系数的绝对值越接近于1,表示样本越相似,越接近于0,表示样本越不相似。

(4)夹角余弦

样本之间的相似度也可以用夹角余弦(cosine)来表示。

夹角余弦越接近于1,表示样本越相似****,****越接近于0,表示样本越不相似。

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数前端工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Web前端开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加V获取:vip1024c (备注前端)
img

最后

CodeChina开源项目:【大厂前端面试题解析+核心总结学习笔记+真实项目实战+最新讲解视频】

❤️ 谢谢支持,喜欢的话别忘了 关注、点赞哦。

前端校招面试题精编解析大全

一个人可以走的很快,但一群人才能走的更远。如果你从事以下工作或对以下感兴趣,欢迎戳这里加入程序员的圈子,让我们一起学习成长!

AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算

戳这里加入程序员的圈子,让我们一起学习成长!**](https://bbs.csdn.net/forums/4304bb5a486d4c3ab8389e65ecb71ac0)

AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算

  • 11
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值