项目暂时告一段落,复习复习!要期末考试了,整理一份宝典备考。文章内容由浅叶轻舟弟弟提供,觉得不错的话,点赞支持一波!
单选
1、下列选项哪个描述的是“训练样本”(B)
A、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果
B、在电子病历数据中,每一个样本有八个检测指标,每个样本还有一个医生诊断结果
C、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果;算法自动得到这些样本的诊断结果
D、在电子病历数据中,每一个样本有八个检测指标,医生根据这八个指标做出诊断
2、下列选项哪个描述的是“分类”(C)
A、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果
B、在电子病历数据中,每一个样本有八个检测指标,每个样本还有一个医生诊断结果
C、在电子病历数据中,每一个样本有八个检测指标,但是没有医生诊断结果;算法自动得到这些样本的诊断结果
D、在电子病历数据中,每一个样本有八个检测指标,医生根据这八个指标做出诊断
3、列哪个选项描述的不是“聚类”(C)
A、搜索引擎返回的文档中,将相似的文档聚合成一类
B、电子商务网站数据中,购物历史相似的用户自动聚合成一组
C、电子商务网站数据中,分析出用户常常一起购买的商品,组合到一起促销
D、在电子病历数据中,将体检指标相似的样本自动聚合成一组
4、在MATLAB语言中,以下说法中错误的是
A、MATLAB中默认的数据类型是double
B、3<5的运算结果是logical类型
C、变量Abc和abc是代表两个相同的变量
D、灰度图的图像矩阵中的数据是uint8类型
5、数据对象的别名不包括(D)
A、记录 B、样本 C、向量 D、特征
6、属性的别名不包括(B)
A、特征 B、样本 C、字段 D、维
7、下列说法不正确的是(C)
A、测量标度是将数值或符号与对象的属性相关联的规则
B、属性的性质不必与用来度量它的值的性质完全相同
C、即使在不同的应用问题中,同一个物理量也必然使用同一种类型的属性来描述
D、属性类型可以划分为:标称、序数、区间、比率这四种
8、某办公自动化系统中,采用出生年份表示雇员的年龄,这是什么类型属性(C)
A、标称 B、序数 C、区间 D、比率
9、某学籍管理系统中,采用百分制表示学生分数,这是什么类型属性(D)
A、标称 B、序数 C、区间 D、比率
10、描述一个数据集的属性主要不包括(A)
A、置信度 B、维度 C、分辨率 D、稀疏性
11、下列说法中错误的是(D)
A、噪声是测量误差的随机部分
B、数据中出现遗漏值的原因,可能是信息没有收集到,或者属性不适用于所有情况。
C、通常由于不同的数据源合并时造成重复数据的产生
D、离群点不可能是合法的数据对象或值
12、下列选项中不属于数据预处理方法的是(B)
A、维归约 B、聚类 C、离散化与二元化 D、属性变换
13、下列说法中错误的是(B)
A、维归约是通过创建新属性,将一些旧属性合并在一起来降低数据集的维度值
B、通过聚集操作,对象或属性群的行为通常比单个对象或属性的行为更加稳定;并且聚集操作不会丢失有趣的细节
C、之所以可以进行特征子集选择,是因为特征中通常包含冗余特征和不相关特征
D、特征创建方法包括:特征提取、映射数据到新的空间、特征构造
多选
1、引发人们对数据挖掘开展研究的挑战性问题包括(ABCDE)
A、可伸缩
B、高维性
C、异种数据和复杂数据
D、数据的所有权与分布
E、非传统的分析
2、下列哪些属于预测性任务(BC)
A、关联规则发现 B、分类 C、回归 D、聚类
3、下列哪些属于描述性任务(AD)
A、关联规则发现 B、分类 C、回归 D、聚类
填空
1、执行完matlab命令“a=[1, 2; 2, 3; 6, 10]”之后,a中的数据有 3 行 2 列
2、执行完matlab命令“a=[2:3:10]”之后,a中的数据依次为2、5、8
3、执行完matlab命令“a=[1, 2; 4, 3; 6, 10]”之后,a(3,2)的值为10
4、执行完matlab命令X=[3 2 0; -5 6 1]; indices =find(X>=1) 之后,变量indices中的值依次是1、3、4、6
5、已知X=[3 2 0 4; -5 6 1 2]; 执行完matlab命令“X(:,2)=[ ]”之后,X矩阵有 2 行 3 列
6、分析以下matlab命令的执行结果:
x=[