![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据库
文章平均质量分 70
喝酸奶舔盖儿的土鳖
事情都是有双面性的。
展开
-
SQL server 2008查询数据库中含有此字段内容的所有表
SQL server 2008查询数据库中含有此字段内容的所有表,并将表与字段插入到临时表中。存储过程如下:USE [cwbase27]GO/****** Object: StoredProcedure [dbo].[global_search] Script Date: 01/13/2015 11:05:22 ******/SET ANSI_NULLS ONGOSET QU原创 2015-01-13 11:06:26 · 1912 阅读 · 0 评论 -
Excel数据导入到oracle数据库
1、将Excel文件保存为*.CSV格式。2、新建一个*.ctl文件,代码如下:load datainfile 'd:\*.csv' append into table student fields terminated by ','trailing nullcols(id,name,sex,age)说明:infile后面参数为欲导入的excel表(已转换成csv格式)路径原创 2015-05-15 13:49:28 · 451 阅读 · 0 评论 -
大数据中数据量打底有多大?
先看下计量单位之间的换算: 1KB (Kilobyte 千字节)=1024B, 1MB (Megabyte 兆字节 简称“兆”)=1024KB, 1GB (Gigabyte 吉字节 又称“千兆”)=1024MB, 1TB (Trillionbyte 万亿字节 太字节)=1024GB, 1PB (Pe原创 2015-05-05 11:31:54 · 2735 阅读 · 0 评论 -
ETL架构师面试题(二)
架构四.在ETL过程中四个基本的过程分别是什么? Kimball数据仓库构建方法中,ETL的过程和传统的实现方法有一些不同,主要分为四个阶段,分别是抽取(extract)、清洗(clean)、一致性处理(comform)和交付(delivery),简称为ECCD。1.抽取阶段的主要任务是:读取源系统的数据模型。连接并访问源系统的数据。变化数据捕获。原创 2015-04-27 17:46:29 · 1435 阅读 · 0 评论 -
ETL架构师面试题(三)
抽取一.简述异构数据源中的数据抽取技术。 在数据仓库项目中,需要抽取的数据经常来自不同的数据源,它们的逻辑结构和物理结构都可能不同,即称之为异构数据源。 在对异构数据源进行整合抽取时,我们需要做的事情依次是标识出所有的源系统,对源系统进行概况分析,定义数据匹配逻辑,建立筛选规则,生成一致性维度。 对于源数据的操作系统平台和数据平台各不相同的情况原创 2015-04-27 17:58:50 · 1139 阅读 · 0 评论 -
ETL架构师面试题(一)
本部分的题目来自Kimball的ETL Toolkit著作。仅供参考分析一、什么是逻辑数据映射?它对ETL项目组的作用是什么? 逻辑数据映射(Logical Data Map)用来描述源系统的数据定义、目标数据仓库的模型以及将源系统的数据转换到数据仓库中需要做操作和处理方式的说明文档,通常以表格或Excel的格式保存如下的信息:目标表名:目标列名:目标表类型:注原创 2015-04-27 17:22:50 · 1579 阅读 · 0 评论 -
ETL初步认识
ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接关接到BI项目的成败。 ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。在设计ETL的时候我原创 2015-04-27 14:44:19 · 747 阅读 · 0 评论 -
ETL架构师面试题(八)
实时ETL一.简述在架构实时ETL时的可以选择的架构部件。 在建立数据仓库时,ETL通常都采用批处理的方式,一般来说是每天的夜间进行跑批。 随着数据仓库技术的逐步成熟,企业对数据仓库的时间延迟有了更高的要求,也就出现了目前常说的实时ETL(Real-Time ETL)。实时ETL是数据仓库领域里比较新的一部分内容。 在构建实时ETL架构的原创 2015-04-29 16:11:35 · 1288 阅读 · 0 评论 -
ETL架构师面试题(七)
优化/操作一.简述数据仓库中的表的基本类型,以及为了保证引用完整性该以什么样的顺序对它们进行加载。 数据仓库中的表的基本类型有维度表、事实表、子维度表、桥接表等几类。其中子维度表即雪花模型由支架维度技术处理,桥接表用来处理多值维度或层级结构。 数据仓库中需要加载的各类表之间有相互依赖的关系,所以加载时需要以一定的顺序进行加载。下面是一些加载的基本原则:原创 2015-04-29 16:02:38 · 2985 阅读 · 1 评论 -
ETL架构师面试题(五)
建立映射一.什么是代理键?简述代理键替换管道如何工作。 在维度表的迁移过程中,有一种处理方式是使用无意义的整型值分配给维度记录并作为维度记录的主键,这些作为主键的整型值称为代理键(Surrogate Key)。使用代理键有很多好处,如隔离数据仓库与操作环境,历史记录的保存,查询速度快等。 同时,在事实表的迁移过程中,为了保证参照完整性也需要进行代理键的替原创 2015-04-29 15:53:53 · 949 阅读 · 0 评论 -
ETL架构师面试题(四)
数据质量一.数据质量检查的四大类是什么?为每类提供一种实现技术。 数据质量检查是ETL工作中非常重要的一步,主要关注以下四个方面。1.正确性检查(Corret)检查数据值及其描述是否真实的反映了客观事务。例如地址的描述是否完全。2.明确性检查(Unambiguous)检查数据值及其描述是否只有一个意思或者只有一个解释。例如地名相同的两个县需要加区分方法。原创 2015-04-29 15:48:22 · 948 阅读 · 0 评论 -
ETL架构师面试题(六)
元数据一.举例说明各种ETL过程中的元数据。 元数据是ETL项目组面对的一个非常重要的主题,对于整个数据仓库项目也是非常重要的一部分。对于元数据的分类和使用没有很确定的定义。 通常来说,我们可以把元数据分为三类,分别为业务元数据(Business Metadata),技术元数据(Technical Metadata)和过程处理元数据(Process Ex原创 2015-04-29 15:59:28 · 885 阅读 · 0 评论 -
Linux下面使用sqlplus热键冲突
问题原因:在Linux环境下面使用sqlplus时,退格键、上下左右键等于Linux热键冲突,在使用xshell以及SecureCRT等客户端同样存在此问题,在使用过程中严重影响工作效率。 解决方案: 一:安装readline [root@oracle10g ~]# rpm -Uvh readline*error: Failed dependencies: libterm原创 2015-05-07 14:35:01 · 505 阅读 · 0 评论