ETL(SSIS)组件使用

BI之SSIS入门、最新版Visual Studio调试技巧以及部分技术栈
• 简介
• 1.1 入门
• 2 ,SSIS控件
o 2.1,Variables
o 2.2,设置数据连接
o 2.3,Sequence Container
o 2.4,Execute SQL Task
o 2.5,Script Task
o 2.6,Data Flow Task
o 2.7,Excel Source Plus
o 2.8,Conditional Split
o 2.9,OLE DB Source
o 2.10,Derived Column
o 2.11,Lookup Plus
o 2.12,Data Conversion
o 2.13,Row Count – Source
o 2.14,OLE DB Destination
• 3.0调试
o 3.1 第一种调试方法
o 3.2 第二种调试方法
o 3.3第三种调试方法
o 3.4第四种调试方法
• 4.0 其他
o Control Flow 控制流程
o Data Flow 数据流程
• SSIS 错误和消息参考
回到顶部(go to top)
简介
最近公司业务需要用到BI SSIS来处理商业智能和大数据,网上大多数是以前版本介绍,没有最新版,响应公司需要,现现学现卖总结一下入门及调试技巧,随便附加常用技术栈。SSIS是什么?“SSIS是Microsoft SQL Server Integration Services的简称,是生成高性能数据集成解决方案(包括数据仓库的提取、转换和加载 (ETL) 包)的平台。
”SQL Server Integration Services (SSIS) 提供一系列支持业务应用程序开发的内置任务、容器、转换和数据适配器。您无需编写一行代码,就可以创建 SSIS 解决方案来使用 ETL 和商业智能解决复杂的业务问题,管理 SQL Server 数据库以及在 SQL Server 实例之间复制 SQL Server 对象。
回到顶部(go to top)
1.1 入门
新建,微软Visual Studio 最近版本新建就不用多说了,如图;
在这里插入图片描述

回到顶部(go to top)
2 ,SSIS控件
2.1,Variables
(1) 参数设置,在Package设计页面空白处“右键”选择参数化,点击 添加参数
在这里插入图片描述
2.2,设置数据连接
(1)在Connection Managers窗口中“右键”创建各种Connection
在这里插入图片描述
2.3,Sequence Container
容器控件,用来将相似的tasks分组,一般用来将所有维度表和事实表处理分开
在这里插入图片描述
2.4,Execute SQL Task
在这里插入图片描述
执行SQL任务
在这里插入图片描述
(1)选中控件,选择Edit
在这里插入图片描述
SQL Statement栏中配置ConnectionType(数据库类型),Connection(数据库),SQLSourceType
SQLSourceType有三种类型:
• Direct input ,直接在SQLStatement中输入SQL语句,若需要参数请用“?”代替
• File connection,File类型连接
• Variable,从我们配置的Variables中选择
(2)配置SQL语句中需要的参数“?”,选中参数映射
在这里插入图片描述
2.5,Script Task

执行C#代码脚本任务,并返回成功或失败,
(1)选中,右键Edit
在这里插入图片描述
选择ReadOnlyVariables,配置需要传入C#代码的参数
在这里插入图片描述
(2)编辑C#代码, 进入代码编辑界面
2.6,Data Flow Task
在这里插入图片描述
数据流任务控件,在其编辑中可放入对数据操作的SSIS控件,
2.7,Excel Source Plus
在这里插入图片描述
将Excel数据源导入数据库,在其Edit界面编辑需要导入的Excel数据源,点击[图片上传失败…(image-2c445-1524627024788)]
添加新的数据源
在这里插入图片描述
2.8,Conditional Split
在这里插入图片描述
可以根据设置的条件函数处理数据,如对数据进行过滤、合并。在其Edit界面,
• Order条件执行顺序,可上下调节
• Output Name 输出名
• Condition配置数据处理条件
在这里插入图片描述
2.9,OLE DB Source

OLEDB类型数据源,在其Edit界面配置数据源
在这里插入图片描述
New添加新数据库,Data access mode选择数据源获取方式,直接选取或者从Variables参数中选取,或者通过SQL语句获取,若SQL语句需要参数点击
配置
在这里插入图片描述
在这里插入图片描述
2.10,Derived Column
在这里插入图片描述
向要导入的数据库表中派生列,其Edit界面
在这里插入图片描述

• Derived Column Name 派生新列的字段名
• Derived Column 派生列的方式
• Expression 新列字段值的表达式
2.11
在这里插入图片描述
将其他数据库表中的字段值插入数据中,其Edit界面
在这里插入图片描述
Input Column 数据中要插入数据的字段名
Reference 需要引用的数据,双击后进入其Edit界面
在这里插入图片描述
首先编辑其需要引用数据的数据库,选择数据库Table/View作为数据源或者通过SQL语句查询数据,Key Column为两表关联字段,Value Column为要插入的数据字段
2.12,Data Conversion
在这里插入图片描述
数据转换,将数据类型转换为MSSQL的数据类型,在其Edit界面选择需要转换的字段即可
在这里插入图片描述
2.13,Row Count – Source
在这里插入图片描述
数据统计,统计处理的数据量,需要在Variables中定义Int32数据类型的参数来接受统计值
在这里插入图片描述
2.14,OLE DB Destination
在这里插入图片描述
OLE DB目标,数据导入的目标,其Edit界面
在这里插入图片描述
配置好需要导入数据的数据库与数据表,若出现 在这里插入图片描述
错误,请点击Mapping仔细检查数据字段匹配是否正确
在这里插入图片描述
回到顶部(go to top)
3.0调试
3.1 第一种调试方法
在这里插入图片描述
如图,再箭头上直接右键 选中Enable Data Viewer,这样运行到这里会停止,并且能看到详细数据情况如下图,点击继续往下走。
在这里插入图片描述
3.2 第二种调试方法
在这里插入图片描述
如图,在package执行时,会出现一个progress显示执行的进度
3.3第三种调试方法
在这里插入图片描述
在这里插入图片描述
选中Execute SQL Task,点击右键,选中Edit Breakpoint来设置断点,进行调试。运行到这里会断点
3.4第四种调试方法
在这里插入图片描述
package 事件调试,可以在事件选中指定事件,当错误出现时,发送runtime的错误信息或将错误信息写入文档,方便捉错误信息。

  • 1
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值