《SQL Server 2005数据挖掘与商业智能完全解决方案》学习笔记(4/12)(Part 1)

 

本文主题是用SSIS对数据进行ETL操作:

 

首先,安装SQL Server2005自带的数据库AdventureWor ks。安装这个数据库分为两种情况。

 

1如果SQL Server2005已经安装好了却没有安装这个数据库。那么

【第一种方法】

开始菜单->所有程序->Microsoft Visual Studio 2005->configuration tools->Notification Services Command Prompt

->键入以下命令

SQLCMD -S (local)/sqlexpress -E

->Enter

->键入以下命令

select physical_name from sys.database_files where name = 'master'

go

(此查询将返回 master.mdf 文件的位置,从而确认将放置 AdventureWorks 数据库文件的 SQL Server 数据目录。)

->键入以下命令(现在将 AdventureWorks 附加到 SQL Server )

exec sp_attach_db @dbname=N'AdventureWorks', @filename1=N'C:/Program Files/Microsoft SQL Server/MSSQL.1/MSSQL/Data/AdventureWorks_Data.mdf', @filename2=N'C:/Program Files/Microsoft SQL Server/MSSQL.1/MSSQL/Data/AdventureWorks_log.ldf'

->键入 go

-> Enter

->键入exit关闭命令窗口

然后到Management Studio中去查看数据库文件,如果有AdventureWorks就说明成功。

 

【第二种方法】

microsoft官方网站上去搜索AdventureWorks,或者点击这里(http://msftdbprodsamples.codeplex.com/releases/view/4004)下载后放入路径n:/Program Files/Microsoft SQL Server/90/Tools/Samples/AdventureWorks OLTP. 然后进行安装,过程如下:

控制面板->添加删除程序->更改或删除程序->进行SQL Server 2005的更改->Change Installed Components->进入Feature Selection向导->Books Online Documentations and Samples->DataBases->AdventureWork Sample OLTPAdventureWorksDW Sample DataWarehouse

 

 

2如果还没有装SQL,那就在安装的时候做好自定义。

【第三种方法】

如果还没有装SQL,那就在安装的时候做好自定义。与上面类似,Feature Selection向导->Books Online Documentations and Samples->DataBases->AdventureWork Sample OLTPAdventureWorksDW Sample DataWarehouse

 

 

 

然后,以下部分介绍SSIS的四个主要组成部分:

Integration Services服务,Integration Services对象模型,Integration Services运行时和运行时可执行的包,数据流任务。

SQL Server官网上的图显示了以上四个组成部分之间的关系:

 

SSIS组件关系图

 

 

最后,以下部分简单介绍SSIS的创建过程:

1 打开SQL Server Management Development Studio。新建一个Integration Services项目。

2 这样就打开了SSIS设计器。在SSIS设计器中,有四个管理标签,分别用于生成包控制流,数据流,事件处理程序和查看包的内容。当切换不同的管理标签是,窗口左侧的工具箱会有不同的组件出现。

3 设置连接管理器。

用鼠标右键单击“连接管理器”区域中的任意位置,在弹出的快捷菜单中选择“新建OLE DB连接”命令。

在“配置OLE DB连接管理器”对话框中单击新建按钮,在弹出对话框选择对应服务器的AdventureWorks数据库。并测试连接。

4 把管理标签切换为控制流,从工具箱中选择“数据流任务”以及“文件系统任务”。将“数据流任务”名字修改为“计算归档值”,将“文件系统任务“的名字修改为“备份”。将“数据流任务”下的绿色箭头拖动到“文件系统任务”中,这样就建立好了二者之间的连接。

5 从工具箱中拖动“序列容器”到设计界面中,并且把已经设定好的“数据流任务”和“文件系统任务”都放入“序列容器”中。

6双击“计算归档值”,进入数据流管理界面。

7 按照和在控制流管理界面相似的方式,选择合适的组件。比如,以书为例,分别选择“OLE DB(OLE DB source)”,“派生列(derived column)”,“聚合(aggregate)”,“排序(sort)”,“平面文件目标(plaint text destination)”。然后依次定义好各个组件之间的数据连接。这样数据流管理界面的任务就完成了。

8 回到控制流管理界面,定义已改名为“备份”的“文件系统任务”。

9 运行包。

 

 

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值