BI数据分析笔试题
一、华为音乐外包
1.数据仓库测试
ETL测试是为了确保从源到目的数据经过业务转换完成后是准确的。
同时它还涉及数据的验证,及从源头到目的地数据各个不同阶段验证数据。
测试流程:
分析业务和需求---测试计划和评估---设计测试用例及准备测试数据---执行测试报告bug及回归测试---生成测试报告、并对结果进行分析---测试完成
五大阶段:
分析需求、业务和源数据
获取数据
实现业务逻辑和维度建模
构建和填充数据
生成报告
测试类型:
production validation testing
source to target testing (validation testing)
application upgrades--升级测试
metadata testing--元数据测试
data completeness testing--数据完整性测试
data accuracy testing--数据准确性测试
data transformation testing--数据转换测试
data quality testing--数据质量测试
incremental ETL testing--增量ETL测试
GUI/navigation testing
2.可视化时间空间数据
空间场数据:通过空间维度与属性的特征共同命名
场数据大多与时间、空间、地理位置有关
等高线图、曲面图、矢量场图都是可视化空间数据的技术
时间概念为我们所定义,本质可以描述为物质连续运动的过程
参考文章地址
3.信息与熵的计算
符号 Xi 的信息定义为:
I ( X i ) = − l o g 2 p ( X i ) I(X_i) = -log_2p(X_i) I(Xi)=−log2p(Xi