【20200310】数据挖掘课程课业打卡一
叮嘟!这里是小啊呜的学习课程资料整理。好记性不如烂笔头,今天也是努力进步的一天。一起加油进阶吧!
课业打卡一之数据挖掘绪论
一、单选题
1、下列选项哪个描述的是“训练样本”
A、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果
B、在电子病历数据中,每一个样本有八个检测指标,每个样本还有一个医生诊断结果
C、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果;算法自动得到这些样本的诊断结果
D、在电子病历数据中,每一个样本有八个检测指标,医生根据这八个指标做出诊断
正确答案: B
题目涉及知识点:
训练样本
: 训练过程中所使用的属性和类别都已知的数据对象即为训练样本 。训练过程
:通过寻找其中的规律 ,得到一个目标函数或分类规则 。测试样本
:测试过程中所使用的属性值已知但类别未知的数据对象即为测试样本 。测试过程
:使用目标函数或分类规则,预测每个测试样本的类别 。
2、下列选项哪个描述的是“分类”
A、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果
B、在电子病历数据中,每一个样本有八个检测指标,每个样本还有一个医生诊断结果
C、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果;算法自动得到这些样本的诊断结果
D、在电子病历数据中,每一个样本有八个检测指标,医生根据这八个指标做出诊断
正确答案: C
题目涉及知识点:
分类定义
3、下列哪个选项描述的不是“聚类”
A、搜索引擎返回的文档中,将相似的文档聚合成一类
B、电子商务网站数据中,购物历史相似的用户自动聚合成一组
C、电子商务网站数据中,分析出用户常常一起购买的商品,组合到一起促销
D、在电子病历数据中,将体检指标相似的样本自动聚合成一组
正确答案: C
题目涉及知识点:
聚类定义
旨在发现紧密相关的观测值组群 ( 簇 ), 使得与属于不从簇的观测值相比 , 属于同一簇的观测值相互之间尽可能类似
。
4、在MATLAB语言中,以下说法中错误的是()
A、MATLAB中默认的数据类型是double
B、3<5的运算结果是logical类型
C、变量Abc和abc是代表两个相同的变量
D、灰度图的图像矩阵中的数据是uint8类型
正确答案: C
二、多选题
1、引发人们对数据挖掘开展研究的挑战性问题包括(多选) :
A、可伸缩
B、高维性
C、异种数据和复杂数据
D、数据的所有权与分布
E、非传统的分析
正确答案: ABCDE
2、下列哪些属于预测性任务(多选)
A、关联规则发现
B、分类
C、 回归
D、 聚类
正确答案: BC
3、下列哪些属于描述性任务
A、关联规则发现
B、分类
C、回归
D、聚类
正确答案: AD
三、填空题
1、执行完matlab命令“a=[1, 2; 2, 3; 6, 10]”之后,a中的数据有_行_ 列
正确答案:3;2
2、执行完matlab命令“a=[2:3:10]”之后,a中的数据依次为 __ 、__ 、__ 。
正确答案:2;5;8
3、执行完matlab命令“a=[1, 2; 4, 3; 6, 10]”之后,a(3,2)的值为___。
正确答案:10
知识点汇总
1、数据挖掘五大任务
2、关于数据挖掘定义
定义1:
在大型数据存储库中,自动地发现有用信息的过程 。
Exploration & analysis, by automatic or semi-automatic means, of large quantities of data in order to discover meaningful patterns.
定义2:
从大型数据集中提取有趣的 ( ( 非平凡的 , 蕴涵的 , 先前未知的并且是潜在有用的 ) 信息或模式。
Non-trivial extraction of implicit, previously unknown and potentially useful information from data.
3、简例判断数据挖掘
Ending!
更多课程知识学习记录随后再来吧!
就酱,嘎啦!
注:
我们愈是学习,愈觉得自己的贫乏。 —— 雪莱