day15--机器学习--聚类(1)

主要的无监督学习方法

聚类(Clustering)如何将教室里的学生按爱好、身高划分为5类?

降维( Dimensionality Reduction )如何将将原高维空间中的数据点映射到低维度的空间中?

关联规则( Association Rules)很多买尿布的男顾客,同时买了啤酒,可以从中找出什么规律来提高超市销售额?

推荐系统( Recommender systems)很多客户经常上网购物,根据他们的浏览商品的习惯,给他们推荐什么商品呢?

机器学习的大多数应用都是基于有监督学习的,但是绝大多数可用数据都没有标签:具有输入特征X,但是没有标签y。

聚类:识别相似实例并将其分配给相似实例的集群或组。就像在分类中一样,每个实例都分配给一个组。但是与分类不同,聚类是一项无监督任务。聚类是很好的工具,用于数据分析、客户细分、推荐系统、搜索引擎、图像分割、半监督学习、降维等。

聚类的应用

客户细分:

你可以根据客户的购买记录和他们在网站上的活动对客户进行聚类。这对于了解你的客户是谁以及他们的需求很有用,因此你可以针对每个细分客户调整产品和营销活动。例如,客户细分在推荐系统中可以很有用,可以推荐同一集群中其他用户喜欢的内容。

数据分析:

在分析新数据集时,运行聚类算法然后分别分析每个集群。

异常检测(也称离群值检测):

对所有集群具有低相似度的任何实例都可能是异常。例如,如果你已根据用户行为对网站用户进行了聚类,则可以检测到具有异常行为的用户,例如每秒的请求数量异常。异常检测在检测制造生产线中的缺陷或欺诈检测中特别有用。国家反诈APP、金融欺诈。

搜索引擎:

一些搜索引擎可让你搜索与参考图像相似的图像或者相似问题。社交网络比如在社交网络的分析上。已知你朋友的信息,比如经常发email的联系人,或是你的微博好友、微信的朋友圈,我们可运用聚类方法自动地给朋友进行分组,做到让每组里的人们彼此都熟识

 

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值