大数据分析与数据挖掘(面试题三,全部√对12道)

铁柱和铁蛋

已于 2024-09-07 08:41:40 修改

阅读量366

点赞数 3

文章标签：数据挖掘数据分析人工智能

于 2024-09-06 19:40:38 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2402_84441896/article/details/141967689

版权

三、判断题（将判断结果填入括号中。正确的填“ √ ”，错误的填“ × ”）

1、对于 SVM 分类算法，待分样本集中的大部分样本不是支持向量，移去或者减少这些样本对分类结果没有影响。（ √ ）（共 1 分）

2、Apriori 算法是一种典型的关联规则挖掘算法。（ √ ）（共 1 分）

3、大数据技术是指处理超过传统计算机处理能力范围的数据。（ √ ）（共 1 分）

4、数据处理通常分成两大类：联机事务处理和联机分析处理。（ √ ）（共 1 分）

5、项集 A 发生，则项集 B 也同时发生的概率为关联规则的置信度。（ × ）（共 1 分）

6、Numpy 包正确的安装命令如下：pip python install numpy。（ × ）（共 1 分）

7、数据取样时，除了要求抽样时严把质量关外，还要求抽样数据必须在足够范围内有代表性。（ √ ）（共 1 分）

8、Web 数据挖掘是通过数据库仲的一些属性来预测另一个属性，它在验证用户提出的假设过程中提取信息。（ × ）（共 1 分）

9、K 均值是一种产生划分聚类的基于密度的聚类算法，簇的个数由算法自动地确定。（ × ）（共 1 分）

10、对于大数据而言，最基本、最重要的要求就是减少错误、保证质量。因此，大数据收集的信息量要尽量精确。（ × ）（共 1 分）

11、相关性分析是数据特征分析方法。（ √ ）（共 1 分）

12、时序预测回归预测一样，也是用已知的数据预测未来的值，但这些数据的区别是变量所处时间的不同。（ × ）（共 1 分）

13、分类是构造一个分类模型，输入样本的属性值，输出对应的类别，将每个样本映射到预先定义好的类别。（ √ ）（共 1 分）

14、数据挖掘的主要任务是从数据中发现潜在的规则，从而能更好的完成描述数据、预测数据等任务。（ √ ）（共 1 分）

15、全链对噪声点和离群点很敏感。（ × ）（共 1 分）

16、维度可以根据其变化快慢分为元变化维度、缓慢变化维度和剧烈变化维度三类。（ √ ）（共 1 分）

17、数据规范化指将数据按比例缩放（如更换大单位），使之落入一个特定的区域（如 0-1）以提高数据挖掘效率的方法。规范化的常用方法有：最大-最小规范化、零-均值规范化、小数定标规范化。（ √ ）（共 1 分）

18、因变量和自变量之间呈现某种曲线关系时，需要建立线性回归模型。（ × ）（共 1 分）

19、分类精度（Precision）表示模型正确分类的正例样本数与总的正例样本总数的比值。（ √ ）（共 1 分）

20、关联规则的经典算法包括 Apriori 算法和 FP-growth 算法,其中 FP-grownth 算法的效率更高。（ √ ）（共 1 分）

铁柱和铁蛋

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。