一、单项选择题
1、考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近 邻,所以应该选择____的相似度计算方法。(D )(共 1 分)
A、平方欧几里德距离
B、余弦距离
C、直接相似度
D、共享最近邻
2、发现关联规则的算法通常要经过以下三个步骤:连接数据,作数据准备;给定最
⼩⽀
持度和__,利
⽤
数据 挖掘⼯
具提供的算法发现关联规则;可视化显
⽰
、理解、评估关联规则。(D )(共 1 分)
A、最
⼩
兴趣度
B、最
⼤⽀
持度
C、最
⼩
置信度
D、最
⼩
可信度
3、有关数据仓库的开发特点,不正确的描述是?( A)(共 1 分)
A、数据仓库开发要从数据出发
B、数据仓库使用的需求在开发出去就要明确
C、数据仓库的开发是一个不断循环的过程,是启发式的开发
D、在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没
有固定的模式
4、社交网络产生了海量用户以及实时和完整的数据,同时社交网络也记录了用户群体的______,通过深入挖掘这些数 据来了解用户,然后将这些分析后的数据信息推给需要的品牌商家或是微博营销公司。(B )(共 1 分)
A、地址
B、行为
C、情绪
D、来源
5、概念分层图是什么图?( B)(共 1 分)
A、无向无环
B、有向无环
C、有向有环
D、无向有环
6、大数据的价值是通过数据共享、______后获取最大的数据价值。( D)(共 1 分)
A、算法共享
B、共享应用
C、数据交换
D、交叉复用
7、以下哪项是 Python 中最常
⽤
的可视化
⼯
具之
⼀
?(