大数据技术概论习题(3)

本文是一份关于大数据技术的习题集,涵盖了单选题、多选题、填空题和判断题,涉及数据采集工具、数据规范化、ETL过程、数据清洗、数据来源、数据规约策略等内容,旨在帮助读者巩固大数据基础知识。
摘要由CSDN通过智能技术生成

一.单选题

1
数据采集工具不包括(C)
A、Flume
B、Kafka
C、Hbase
D、Sqoop

2
关于数据的规范化的错误观点是(A)
A、方便存储
B、一般包括数据中心化和数据标准化
C、是为了消除量纲对数据结构的影响
D、一般是一个无量纲的纯数值

3
在ETL三个部分中,花费时间最长的是(B)的部分。
A、E
B、T
C、L
D、以上全部

ps:什么是ETL
ETL是数据仓库的后台,主要包含抽取、清洗、规范化、提交四个步骤
ETL代表Extract-Transform-Load,它是将数据从源系统加载到数据仓库的过程。用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

4
大数据的来源途径有许多,如下哪些属于大数据来源(D)
A、传感器设备采集的数据
B、人在微博上发表的记录
C、计算机网络运行产生的日志
D、网络爬虫得到的数据

5
数据规约策略中错误的是( B)
A、数据立方体聚集策略
B、数据标准化
C、维度规约
D、特征值规约

6
数据清洗的一般过程中,在数据修正后,需要进行( C)
A、定位
B、检测
C、验证
D、构造

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值