无监督学习
机器学习中的无监督学习部分
闷骚的小蝎子
这个作者很懒,什么都没留下…
展开
-
机器学习— 聚类(2)K-means聚类
1.kkk 均值聚类kkk 均值聚类是基于样本集合划分的聚类算法。 kkk 均值聚类将样本集合划分为 kkk 个 子集,构成 kkk 个类, 将 nnn 个样本分到 kkk 个类中,每个样本到其所属类的中心的距离最 小。每个样本只能属于一个类, 所以 kkk 均值聚类是硬聚类。下面分别介绍 kkk 均值聚类 的模型、策略、算法, 讨论算法的特性及相关问题。1.1 模型给定 nnn 个样本的集合 X={x1,x2,⋯ ,xn},X=\left\{x_{1}, x_{2}, \cdots, x_{n}\r原创 2020-11-07 01:37:48 · 318 阅读 · 1 评论 -
机器学习—聚类(一)(L—P范数/闽可夫斯基距离/马氏距离/相关系数/夹角余弦)
机器学习中用样本之间的距离/相似度来表示样本差异,下面介绍几种常用的距离/相似度,顺便介绍一下L—P范数。1.闽可夫斯基距离L—P范数与闽可夫斯基距离的定义一样:Lp=(∑1nxip)1p,x=(x1,x2,⋯ ,xn)Lp=({\sum\limits_{1}^n x_i^p})^{\frac{1}{p}},x=(x_1,x_2,\cdots,x_n)Lp=(1∑nxip)p1,x=(x1,x2,⋯,xn)当p=1p=1p=1时,称为曼哈顿距离当p=2p=2p=2时,称为欧氏距离原创 2020-07-01 21:52:44 · 1461 阅读 · 0 评论 -
无监督学习之关联规则分析(—):基本概念总结
一、关联规则分析(一) 关联规则分析也称为购物篮分析,早期是为了发现超市销售数据中不同商品的关联关系,可以帮助超市了解客户的购买模式和习惯,以便于制定更好的销售计划。可以求出当a数据出现时b数据出现的可能性。常用的算法有Apriori,FP-Tree,Eclat,灰色关联算法,本篇主要介绍关联规则的一些基本概念和参数。1.首先介绍一些基本概念1.1项: 超市用户购买数据库中所保存的所购买的产品称之为项,例如面包,矿泉水,都属于项。1.2项集: 一次所购买东西的总和叫做项集,例如我今天去超市买原创 2020-06-10 00:58:15 · 2742 阅读 · 1 评论 -
无监督学习之关联规则分析(二):Apriori算法原理
关联规则分析(二):在上篇博客中介绍了关联规则分析的一些基本知识,将在接下来这几篇中总结一些关联规则的算法。这篇总结的是最经典的求关联规则的算法:Apriori算法。1.求出频繁项集:因为直接解释比较抽象,所以用例子来理解算法会更容易理解,假设某人在某超市连着几天的购买事务如下:天数事务/项集1{方便面,火腿肠,面包}2{火腿肠,矿泉水}3{火腿肠,可乐}4{方便面,火腿肠,矿泉水}5{方便面,可乐}6{火腿肠,可乐}7{方便面原创 2020-06-10 02:58:54 · 799 阅读 · 0 评论