这里选取的实例数据库是 Adventureworks Data warehouse 下载链接如下:https://docs.microsoft.com/en-us/sql/samples/adventureworks-install-configure?view=sql-server-ver15
最后要从这个源数据库中抽提出我需要的八张表做个销售分析,表如下:
1)首先我们需要连接到数据库(我因为先把数据库下载到本地SSMS,所以server是我的本地)
2)进入query editor先进行data transformation, 选中不需要的列,删掉不需要的列,如果需要删除的列很多,那就选择需要的列,反向‘删除其他列’。
3)可以用merger columns 把姓氏和名字合并成一列
在这张表的最后一列就是我们新合成的列,删除原来的三个旧列即可。
4)Fact table 中添加Order Year 这一列,因为这样之后视图比较方便,我们就从date time格式的Order Date这列中转换,选择 ‘Add column’--’Date’--’Year’, 这样就得到新列了。
5)Close and apply 关掉query editor并把处理完的数据导入模型中
6) Add new column
在fact table 里面我们有 sales amount 这列表示销售总额,Total Product Cost 这一列表示成本(这里为了简化,运费列不计算其中)那么,我们想增加一列计算利润=销售总额-成本。
(注意,在主界面左方有三个tab,第一个report tab可视化,第二个data tab 做数据的计算,第三个model tab,方便查看表之间的关系。)
在data tab中,选择 ’new column’,并写入计算公式(这里以计算利润为例)。
7) 在model tab 里面,可以看到表之间呈snowflake型的模型。
8)回到report tab,下一篇开始对每一种可视化图表进行探讨。