【无标题】数据挖掘与机器学习,数据挖掘的六大任务

     数据挖掘是指从大量数据中发现潜在的有价值的只是的过程,机器学习是一种利用数据训练模型的算法。可以理解为机器学习是数据挖掘的方法之一。

ed2c58353dc74edeac5db0197beedf5b.jpg

        数据挖掘有一下六大任务,分别是:分类问题、聚类问题、回归问题、关联问题、序列问题、异常值检测问题。

        分类问题是指从训练样本中学习,构建一个函数(分类器),对样本的所属类别进行判别。典型的分类问题有垃圾邮件识别、文本分类、信用评分、欺诈检测、图像识别、用户流失预测、营销响应预测、广告点击率预估、商品推荐等3039b90f72644a2fa9b1730d4ae7aa38.jpg

        聚类问题是指从数据中探索样本之间的相似性,把特征相似的具为一类,是一种无目标的探索性分析。典型聚类问题包括用户分群,想死文档聚类等。

0504ffc39c3d442ea12f6092e811f8f1.jpg

       回归问题指从训练样本中学习,构建一个函数,对样本目标变量进行估值。典型回归问题有:房价预测,收入预测等。

4e5a80004d0e4f0b8e4e59e58f8b5c4b.jpg

       关联问题是指从交易型数据中发现频繁关联出现的商品,又称购物篮分析。例如

f61fa776891940b095511d5c8173386f.jpg

 买牛奶的顾客往往同时会买面包和鸡蛋。典型的关联问题有商品买了还买,电影看了还看和商品推荐等。

         序列问题是指从顺序型数据中发现序列模式,例图九个月前买了pc的用户往往下一个月会买一根内存条。典型序列问题包括购物模式预测、网站点击模式预测、中文分词、DNA序列分析。

b36acb3a97aa44a7aa9d744beb53e25d.jpg

        异常值检测问题是指检测样本取值是否显著偏离常规,发现有意义的孤立点和异常值。

典型异常值检测问题包括信用卡行为检测、网络安全检测、不合格产品检测。 

79211efa34594a1787cde438131e63ad.jpg

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值