某公司的数据仓库考题

某公司的数据仓库考题

转自:www.bicubes.com (BI立方体-商业智能社区:做中国最大的商业智能社区)

作者:Keith




1.请简要您说明对数据仓库概念的理解。

面向主题、集成、相对稳定、反映历史、用于决策支持的数据集体。




2.请解释以下概念:

数据集市,事实表,维表,钻取,OLAP,粒度,KPI,ETL

数据集市:企业级数据仓库一个子集,面向部门级业务并且面向某个特定的主题。

事实表:进行分析的实体表,里面包含维表关键字与度量值。

维表:事实表的一个观察角度。

钻取:分上钻、下钻。得到数据的汇总信息或者明细信息。

粒度:数据细分或综合程度。

3.请列举您使用过的各种数据仓库工具软件(包括建模工具,ETL工具,前端展现工具,OLAP Server、数据库、数据挖掘工具)和熟悉程度。

(稍做深入地回答你所用产品所完成的功能)





4.请用C++或其他高级程序语言,写一段程序,功能是生成2000年至2010年的全部日期数及该日期是星期几,写入一逗号分割的文本文件,也可用PL/SQL将数据插入到一张临时表中。(上机,或将代码直接写下)





5.您有无使用过Oracle的分区、位图索引、执行计划分析功能?位图索引与普通索引的区别是什么?什么时候使用位图索引?



6.您使用过何种unix系统?写一条shell语句,完成功能:

在当前系统时间5小时后将目前目录下全部文件列表输出到一个文件File_list中。





7.一台有两个CPU的UNIX机器,2G内存,带一个300G磁盘阵列,数据库是Oracle8i或Sybase IQ 12。有5张主要事实表,初始数据装载30G原始数据,以后每天每张事实表增加约200M原始 数据,每张表约有5~10个可分析角度需与维表关联,要求第二天能从数据仓库中访问头一天的数据。白天数据源所在的业务系统数据库不能访问,请简要说明您的数据初始装载策略、数据刷新策略、索引策略、系统参数及针对Oracle或SybaseIQ的数据库参数设置。





8.您对数据仓库中的缓慢变化维,比如客户登记信息的地址变动,代理商变动等信息变动如何处理,以保证数据完整一致?





9.您对元数据管理在数据仓库中的运用有何心得?









10. 解释以下Oracle数据库概念:Tablespace, Extent, Segment。





11.说明Oracle表中的存储参数initial, next, pctfree, pctused的含义。针对只做批量装载,没有update的数据仓库事实表,这些参数的设置原则。





12.列出SybaseIQ中的几种索引类型,说明这些索引各自的特点,针对不同的查询需求和数据内容,这些索引的使用原则及场合。

 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值