SSIS控件

https://ask.hellobi.com/question/2340

 

小弟正在自学微软BI中,目前在看SSIS,想问下实际工作中SSIS用到的相关技术
1.你们会使用数据事件探查任务确定源中值的质量和范围吗?
2.会用到SCD来处理维度ETL吗?
3.级联查找操作时会使用帕累托原则吗?第一个查找转换使用完全缓存,存储了 20%的参考行,并有希望成功应答80%的查找应求。如果查询到了错误数据(剩下20%的失败查询),那么可以将它们重定向到部分缓存查找转换中,该操作针对其他的80%的数据来进行。 
4.数据清洗的时候会使用查找转换和模糊查找转换以及有条件查找结合的方式吗?
5.会使用DQS数据质量服务吗?
6.对变更数据的捕获,你们通常会使用什么解决方案呢?会用CDC吗?
7.数据库快照和Merge运算符常用吗?
8.可靠性和可扩展性方面,使用检查点和包事务吗?
9.关于数据流重新启动,大家会将数据流划分成多个独立任务,并通过原始文件链接每个任务,使其获取重新
启动合并流的能力吗?




希望大神们解答我的疑惑!多谢啦

0评估数据源.png1.png2.png4.jpgCDC.png事实表抽取.png

 

 

1.你们会使用数据事件探查任务确定源中值的质量和范围吗?
答:这个数据事件探查任务用的不多,最多的就是用的 日志记录来捕获各个控件的日志记录。 源的质量和范围这个应该是这需求分析中确认而来的。
2.会用到SCD来处理维度ETL吗?
答: 这个SCD主要来处理缓慢变化维度的,还是比较常用的控件。如果数据仓库中有一些随时间变化的粒度,比如 员工的职位、员工的入职时间等都会用到。

3.级联查找操作时会使用帕累托原则吗?第一个查找转换使用完全缓存,存储了 20%的参考行,并有希望成功应答80%的查找应求。如果查询到了错误数据(剩下20%的失败查询),那么可以将它们重定向到部分缓存查找转换中,该操作针对其他的80%的数据来进行。 
答: 帕累托原则 这个貌似不懂了。

4.数据清洗的时候会使用查找转换和模糊查找转换以及有条件查找结合的方式吗?
答: 数据清洗的时候查找控件还是比较查用的,一般都是跟条件查找结合的方式来实现,但 这种查找及模糊查找的方式会产生很大的性能问题,最好不要用。。能够通过普通SQL实现的话,就直接通过SQL去实现。

5.会使用DQS数据质量服务吗?
答:DQS不常用

6.对变更数据的捕获,你们通常会使用什么解决方案呢?会用CDC吗?
答:对数据变量的捕获,一般采用 时间戳或者CDC的方式或者全表比对。。时间戳是最常用的变更数据捕获的方式了。。CDC我们在项目开发中也用到了,但是如果用了CDC是非常不利于项目的迁移和拓展的。

7.数据库快照和Merge运算符常用吗?
答:数据库快照是管理方面的知识。Merge运算符一些简单的逻辑可以在SSIS使用。

8.可靠性和可扩展性方面,使用检查点和包事务吗?
答:可靠性和可扩展性方面,使用脚本任务和变量的方式结合用的比较多。

9.关于数据流重新启动,大家会将数据流划分成多个独立任务,并通过原始文件链接每个任务,使其获取重新
启动合并流的能力吗?
答:这个要开业务需求了,比如一个数据流我要实现到往多个表插入数据库,那就需要将数据流拆分成多个任务。。

 

 

------------------------------------------------------------------------------------------------

 

DQS 是2012的新功能,借助它可以实现更好的数据质量。

在进行模糊查找匹配之前,因为模糊查找相对比较耗费资源 而且它是一个全阻塞控件,对服务器的性能要求很高。
所以建议在进行模糊查找匹配之前先使用一般查找匹配,然后。。。你懂得。

CDC这个东西是微软为你分装好的SCD, 增量更新解决方案,为了灵活很多地方都是自己开发。
Merge对于增量更新用的也非常多,或者 CheckSum.

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
SSIS(SQL Server Integration Services)是一款在SQL Server数据库中用于数据集成和转换的强大工具。它通过使用图形化的用户界面和可拖放的操作,允许用户创建、管理和部署复杂的数据集成流程。 SSIS提供了多个控件用于满足不同的需求。以下是几个常用的SSIS控件及其使用案例: 1. 数据流任务(Data Flow Task):数据流任务是SSIS中最重要的控件之一。它允许用户定义数据的流动路径和转换,从而实现对数据的提取、转换和加载(ETL)操作。数据流任务可以连接多个源和目标,并通过各种转换操作来处理数据。 案例:假设我们需要将一个CSV文件中的数据加载到SQL Server数据库中。我们可以使用数据流任务来设置一个CSV文件作为数据源,通过数据流路径将数据流向SQL Server数据库表。 2. 执行SQL任务(Execute SQL Task):执行SQL任务允许用户执行SQL命令或存储过程。该任务可以连接到任何支持SQL的数据库,并提供了灵活的选项用于执行SQL操作。 案例:假设我们需要在数据集成流程中执行一个存储过程来更新目标数据库中的数据。我们可以使用执行SQL任务来连接到目标数据库,并设置相应的SQL命令来执行存储过程。 3. 文件系统任务(File System Task):文件系统任务允许用户在数据集成过程中对文件系统进行操作,如创建文件夹、复制文件、删除文件等。 案例:假设我们需要在数据集成流程中将一个生成的报告文件转移到指定的文件夹中。我们可以使用文件系统任务来设置相应的操作,如复制文件和删除源文件。 总的来说,SSIS控件提供了丰富的功能和选项,可以满足各种数据集成和转换的需求。通过熟练掌握不同的控件,用户可以设计和实现复杂的数据流程,提高数据管理和处理的效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值