第一单元 导言
-
数据挖掘又称从数据中发现知识,后者英文简称为(C )。
A.KPD
B.KPP
C.KDD Knowledge discovery from database
D.KDP -
数据挖掘又称从数据中发现知识,前者英文简称为( )。
A.DD
B.KPP
C.DM Data Mining
D.KDD -
结构化的数据是指一些数据通过统一的( )的形式存储的,这类数据我们称为结构化的数据。
A.文档
B.二维表格
C.图像
D.声音 -
数值预测用于连续变量的取值,常用的预测方法是( )。
A.聚类
B.分类
C.回归分析
D.关联 -
下列应用场景不属于分类的是( )。
A.医生根据患者的症状判断所患疾病类型
B.为了解用户特点,公司将客户分群
C.对信用卡申请者判断其信誉高低
D.推广新产品时预测已有客户是否对新产品感兴趣 -
一般数据挖掘的流程顺序,下列正确的是( )。
①选择数据挖掘的技术、功能和合适的算法
②选择数据,数据清洗和预处理
③了解应用领域,了解相关的知识和应用目标
④寻找感兴趣的模式、模式评估、知识表示
⑤创建目标数据集
A.③②⑤①④
B.⑤④②①③
C.③④①⑤②
D.③⑤②①④ -
数据挖掘包括下面哪些方法( )。
A.分类
B. 异常发现
C.关联
D. 聚类 -
数据挖掘和哪些学科领域有关系( )。
A.优化
B.统计
C.数据库
D.机器学习 -
聚类针对有标签的数据。 ×
-
分类和回归都可用于预测,分类的输出是离散的类别值。 √
-
分类就是根据物以类聚的原理,将没有类别的对象根据对象的特征自动聚成不同簇的过程。 ×
-
序列分析经常会用在购物篮分析中。×
-
关联分析是数据分析中常用的分析方法。√
-
在这个大数据爆炸的时代,我们期待能够从这些数据中提炼出有用的知识,解决的方法就是数据仓库技术和 数据挖掘 技术。
-
在这个大数据爆炸的时代,我们期待能够从这些数据中提炼出有用的知识,解决的方法就是 数据仓库 技术和数据挖掘技术。
-
从存储方式对数据类型进行分类,可分为 结构化 数据和 非结构化 数据。(输入两个位置的答案时,以一个空格作为分隔符)
-
预测的模型构建需要 历史数据 来进行分析。
-
分类 就是根据有类别的数据提供的信息,来概括类别的主要特征,构建模型或者规则,根据该模型或者规则预测对象的类别。