大数据分析与数据挖掘 (面试题一)

铁柱和铁蛋

已于 2024-09-07 08:43:31 修改

阅读量1.2k

点赞数 7

文章标签：数据挖掘数据分析人工智能大数据

于 2024-09-06 19:27:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2402_84441896/article/details/141967321

版权

一、单项选择题

1、考虑这么一种情况：一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择____的相似度计算方法。（D ）（共 1 分）

A、平方欧几里德距离

B、余弦距离

C、直接相似度

D、共享最近邻

2、发现关联规则的算法通常要经过以下三个步骤：连接数据，作数据准备；给定最⼩⽀持度和__，利⽤数据挖掘⼯具提供的算法发现关联规则；可视化显⽰、理解、评估关联规则。（D ）（共 1 分）

A、最⼩兴趣度

B、最⼤⽀持度

C、最⼩置信度

D、最⼩可信度

3、有关数据仓库的开发特点,不正确的描述是？（ A）（共 1 分）

A、数据仓库开发要从数据出发

B、数据仓库使用的需求在开发出去就要明确

C、数据仓库的开发是一个不断循环的过程,是启发式的开发

D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没

有固定的模式

4、社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的______,通过深入挖掘这些数据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。（B ）（共 1 分）

A、地址

B、行为

C、情绪

D、来源

5、概念分层图是什么图？（ B）（共 1 分）

A、无向无环

B、有向无环

C、有向有环

D、无向有环

6、大数据的价值是通过数据共享、______后获取最大的数据价值。（ D）（共 1 分）

A、算法共享

B、共享应用

C、数据交换

D、交叉复用

7、以下哪项是 Python 中最常⽤的可视化⼯具之⼀？（

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。