BI数据分析笔试题及答案(华为音乐外包)

本文详细介绍了华为音乐外包和一般数据分析笔试中涉及的各类问题,涵盖数据仓库测试流程、可视化时间空间数据、信息熵计算、元数据、数据粒度、数据预处理、非对称二元属性、特征工程、KDD、无标签数据处理、抽样方法、聚类算法、分类器、非频繁模式和离群点检测等知识点。内容深入,适合数据科学和分析领域的学习者参考。
摘要由CSDN通过智能技术生成

一、华为音乐外包

1.数据仓库测试

ETL测试是为了确保从源到目的数据经过业务转换完成后是准确的。
同时它还涉及数据的验证,及从源头到目的地数据各个不同阶段验证数据。

测试流程:
	分析业务和需求---测试计划和评估---设计测试用例及准备测试数据---执行测试报告bug及回归测试---生成测试报告、并对结果进行分析---测试完成
五大阶段:
	分析需求、业务和源数据
	获取数据
	实现业务逻辑和维度建模
	构建和填充数据
	生成报告
测试类型:
	production validation testing
	source to target testing (validation testing)
	application upgrades--升级测试
	metadata testing--元数据测试
	data completeness testing--数据完整性测试
	data accuracy testing--数据准确性测试
	data transformation testing--数据转换测试
	data quality testing--数据质量测试
	incremental ETL testing--增量ETL测试
	GUI/navigation testing

参考文章地址

2.可视化时间空间数据

​ 空间场数据:通过空间维度与属性的特征共同命名
​ 场数据大多与时间、空间、地理位置有关
​ 等高线图、曲面图、矢量场图都是可视化空间数据的技术
​ 时间概念为我们所定义,本质可以描述为物质连续运动的过程
参考文章地址

3.信息与熵的计算

​ 符号 Xi 的信息定义为:
I ( X i ) = − l o g 2 p ( X i ) I(X_i) = -log_2p(X_i) I(Xi)=log2p(Xi

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值