销售数据预处理

实验目的:
1.熟悉Linux系统、MySQL、Insight等系统和软件的安装和使用;
2.了解大数据处理的基本流程;
3.熟悉数据抽取、转换、装在方法;
4.熟悉在不同类型数据库之间进行数据相互导入导出
实验内容:
本实验对两个数据源:employee_info_table.sql代表员工信息表;sales_info_table.sql表示销售信息表做数据预处理。
实验过程:

1.实验准备:
1.1启动数据库:

sudo -i
service mysql start
mysql -uroot -p123456
show databases

在这里插入图片描述

1.2使用数据库mysql

use mysql

1.3导入sql文件

source employee_info_table.sql;
source sales_info_table.sql;

2.实验步骤:
2.1. Insight链接mysql数据库:
创建transformation
在这里插入图片描述
连接数据库Mysql_ETL_A,同样的方式连接Mysql_ETL_B
在这里插入图片描述
完成后:
在这里插入图片描述
2.2 抽取数据库中数据:
把控件table input拖拽到工作区添加数据文件Mysql_ETL_A,命名student_info;同样的方式添加Mysql_ETL_B,命名
在这里插入图片描述
完成后:
在这里插入图片描述
3.数据转换
3.1 对学生信息表进行整理排序
将sort rows设置成student_info的下一步,添加字段,最后只留下emlioyee_number.
在这里插入图片描述
3.2 对销售信息表进行整理,将select values设置成sales_info的下一步,添加字段,在select&alter栏中只留下emloyee_number、sales、profits字段。
`在这里插入图片描述
在 Select values 后连接一个新的 Sort rows,按照 Employee_number进行升序排序
在这里插入图片描述
3.3 完成两个信息表的整合
在这里插入图片描述
在merge join后面连接一个新的select values,在remove中留下department,other,employee_number_1.
在这里插入图片描述
4.数据装载
把整理好的数据表保存到数据库中
4.1 在select values连接table output,设置并设置。
在这里插入图片描述

完成后退出窗口,并运行:
在这里插入图片描述
最后打开Table output表即可查看数据预处理后的信息

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

让头发掉下来

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值