数据挖掘笔记（四）

最新推荐文章于 2024-01-09 16:03:07 发布

Y_lx

最新推荐文章于 2024-01-09 16:03:07 发布

阅读量381

点赞数

分类专栏：机器学习文章标签：笔记数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29797697/article/details/88048081

版权

这篇笔记主要介绍了数据挖掘中的分类任务，包括基本概念、评估方法和具体分类技术如决策树。决策树的学习与构建过程、属性选择与剪枝策略被详细阐述，同时提到了朴素贝叶斯分类器的概念和概率计算。

摘要由CSDN通过智能技术生成

主要是整理自己在数据挖掘课程上所做的一些笔记。
更多内容可以访问我的个人博客。

分类：基本概念(basic-classification)

基本概念

（1）分类定义：

**目标：**以前未知的对象应该尽可能准确地被分配一个类。

**评估：**使用测试集来确定模型的性能。不同的评估方法包括准确性、召回性、精确性、AUC等。通常，给定的数据集分为训练集和测试集，其中训练集用于建立模型，测试集用于验证模型。

（2）分类任务例子

①　比如预测肿瘤细胞良恶性
②　将信用卡交易归类为合法或欺诈
③　营销经理需要进行数据分析，以帮助猜测具有给定配置文件的客户是否会购买一台新计算机(类别为购买/不购买)。
④　银行贷款官员需要对她的数据进行分析，以了解哪种贷款申请对她的银行是有风险的(课程有风险/没有风险)
⑤　将新闻故事归类为金融、天气、娱乐、体育等。

（3）一般分类方法：通常分为两步：学习模型（归纳），应用模型（演绎）

监督学习方法：决策树、朴素贝叶斯、基于规则的方法、神经网络、支持向量机、懒惰学习（K近邻）、集成方法

基础分类技术

（1

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
数据挖掘笔记（四）

主要是整理自己在数据挖掘课程上所做的一些笔记。更多内容可以访问我的个人博客。分类：基本概念(basic-classification)基本概念（1）分类定义：**目标：**以前未知的对象应该尽可能准确地被分配一个类。**评估：**使用测试集来确定模型的性能。不同的评估方法包括准确性、召回性、精确性、AUC等。通常，给定的数据集分为训练集和测试集，其中训练集用于建立模型，测试集...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。