大数据分析与数据挖掘(面试题三,全部√对12道)

三、判断题(将判断结果填入括号中。正确的填“ ”,错误的填“ × ”)
1、对于 SVM 分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。 ( )(共 1 分)
2、Apriori 算法是一种典型的关联规则挖掘算法。( )(共 1 分)
3、大数据技术是指处理超过传统计算机处理能力范围的数据。( )(共 1 分)
4、数据处理通常分成两大类:联机事务处理和联机分析处理。( )(共 1 分)
5、项集 A 发生,则项集 B 也同时发生的概率为关联规则的置信度。( × )(共 1 分)
6、Numpy 包正确的安装命令如下:pip python install numpy。( × )(共 1 分)
7、数据取样时,除了要求抽样时严把质量关外,还要求抽样数据必须在足够范围内有代表性。( )(共 1 分)
8、Web 数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。 ( × )(共 1 分)
9、K 均值是一种产生划分聚类的基于密度的聚类算法,簇的个数由算法自动地确定。( × )(共 1 分)
10、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。 ( × )(共 1 分)
11、相关性分析是数据特征分析方法。( )(共 1 分)
12、时序预测回归预测一样,也是用已知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。 ( × )(共 1 分)
13、分类是构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别。 ( )(共 1 分)
14、数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。( ) (共 1 分)
15、全链对噪声点和离群点很敏感。( × )(共 1 分)
16、维度可以根据其变化快慢分为元变化维度、缓慢变化维度和剧烈变化维度三类。( )(共 1 分)
17、数据规范化指将数据按比例缩放(如更换大单位),使之落入一个特定的区域(如 0-1)以提高数据挖掘效率 的方法。规范化的常用方法有:最大-最小规范化、零-均值规范化、小数定标规范化。( )(共 1 分)
18、因变量和自变量之间呈现某种曲线关系时,需要建立线性回归模型。( × )(共 1 分)
19、分类精度(Precision)表示模型正确分类的正例样本数与总的正例样本总数的比值。( )(共 1 分)
20、关联规则的经典算法包括 Apriori 算法和 FP-growth 算法,其中 FP-grownth 算法的效率更高。( )(共 1 分)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值