大数据技术概论习题(6)

本文主要介绍了大数据分析中的关联规则算法Apriori和聚类算法,包括K-均值、KNN等。Apriori算法用于挖掘布尔关联规则,K-均值算法用于聚类,KNN则是一种基于邻近度的分类算法。同时提到了Spark生态圈,其核心是Spark Core,MLLib专注于机器学习。
摘要由CSDN通过智能技术生成

一.单选题

1
关于Apriori算法,下列说法错误的是 ( D )

A、
Apriori算法是挖掘布尔关联规则频繁项集的算法

B、
Apriori算法使用一种称作逐层搜索的迭代方法

C、
Apriori算法核心思想简要描述为连接步和剪枝步

D、
Apriori性质:频繁项集的所有非空子集不一定是频繁的。

2
构造决策树,下列的说法错误的是( C )

A、
构造决策树的关键步骤是分裂属性

B、
构造决策树的关键性内容是进行属性选择度量

C、
当属性是离散值且不要求生成二叉决策树时,用属性的每一个划分作为两个分支

D、
属性是连续值,此时确定一个值作为分裂点,按照和生成两个分支

3
k-均值聚类算法中,其中的k 指( B )

A、
数据对象的数据

B、
聚类中心

C、
迭代的次数

D、
待聚类列别数

4
叙述“从n个数据对象任意选择k个对象作为初始聚类中心,对于剩下的其他对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这个过程,直到标准测度函数开始收敛位置。”是对 ( B )算法的描述

A、
KNN

B、
K-均值

C、

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值