Machine Learning 1（输入：概念，实例和属性)

最新推荐文章于 2022-11-26 17:15:33 发布

countryhunter

最新推荐文章于 2022-11-26 17:15:33 发布

阅读量503

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/countryhunter/article/details/8656570

版权

@ Concept

数据挖掘领域的四个不同的学习方式：classification learning（分类学习）关联学习（association learning）聚类（clustering）数值预测（numeric prediction）

1.分类学习优势成为有指导的学习（supervised learning）学习的方案是在指导下进行的，这里说的指导的意思是每一个训练的样本都有一个明确的的结论。这些结论称为样本的类。

2.关联学习中没有指出特定的类，问题是如何在数据中找出有趣的结构，关联规则可以“预测”任何一个属性，不只是类，还可以一次预测一个以上的属性值。

3. 样本不存在一个特定类的时候，可以采用聚类的方法将那些看上去自然会落在一起的样本集合在一起。

4.数值预测是分类学习的一种变体，他预测的是一个值，而不是一个分类。eg：cpu性能问题就是一个预测数值的例子

@样本

1.Machine learning的方案是一个实例集，这些实例通常被称为样本，现在更加专业的术语就是“实例”来表示输入，每一个数据集都可以表示一个实例与属性的矩阵

2.仅明确指出肯定样本且采用一个不变的假设（剩下的都是否定的样本）的做法称为闭合世界假定（closed world assumption）

2.4输入准备

(1)：数据收集

数据仓库（data warehousing）：数据仓库提供了一个访问成组数据的借口，他超越了部门的界限。

(2)：ARFF格式文件

ARFF格式文件：是一个独立，无序的实例组成的数据集标准表示方法，该文件不涉及实例间的关系。（具体看书貌似不太懂）

(3)：稀疏数据

(4)：属性类型:ARFF文件格式允许2种基本数据类型：名词性数值和数量值。

(5)：残缺值：通常值得是超出正常范围的数据

(6)：不正确的值，了解数据

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

countryhunter CSDN认证博客专家 CSDN认证企业博客

码龄13年

1: 原创

100万+: 周排名

116万+: 总排名

502: 访问

: 等级

15: 积分

0: 粉丝

0: 获赞

0: 评论

1: 收藏

私信

关注

热门文章

Machine Learning 1（输入：概念，实例和属性) 503

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。