分类技术简介

本文介绍了分类分析在数据挖掘中的重要性,特别是在社交媒体营销、电商推荐和医疗诊断等领域的应用。通过Weka工具,文章将探讨K近邻、决策树和贝叶斯等常见分类算法,阐述分类问题的描述、定义以及训练和测试模型的过程。
摘要由CSDN通过智能技术生成

      “大数据”、“海量数据分析”、“数据挖掘”等已经成为近两年超级流行的词汇:2012年初《纽约时报》刊载《大数据时代降临》,2012达沃斯世界经济论坛讨论“海量数据分析”和“机器学习”将会是未来最大的技术革命之一等等。海量数据中蕴含着丰富的信息,从中挖掘出的“宝藏”将有助于人们做出科学的决策。分类分析作为数据挖掘实际应用中最常用的一种方法,就是判断目标对象属于哪个预先定义好的类。例如:社交管理营销公司通过海量微博用户发表或者转发的微博内容构建分类模型,判断用户属于是“时尚类”还是“体育类”,以便向他们定点营销商品或服务;电商通过海量用户历史的购买行为和购买记录构建分类模型,判断用户是否是某一商品的潜在买家;医院通过海量病人的病历记录构建分类模型,判断新来的一位病人属于哪一种病等等,数据挖掘中的分类技术几乎已经深入到日常生活的许多方面。  

      本系列将介绍分类分析的基本技术,结合Weka讨论分类中常见的模型,如:K近邻分类器、决策树分类器、贝叶斯分类器等常见常见的分类算法。

1、分类问题的描述

      毫无疑问,在我们平时最基本的生活中都会遇到分类问题。依据日常的经验,我一般会把交通工具分为:自行车、汽车、火车、轮船、飞机等;当大家见到这些交通工具时能一眼就辨别出它是什么,这是因为什么呢?为什么大家见到不明飞行物时却不知道它是什么,而把它们统称为UFO(UnidentifiedFlying Object)呢?显然,我们能认识到自行车、汽车等常见交通工具,是因为我

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值