数据导入与预处理——实验一:数据导入与导出

一、实验内容

目的: 掌握使用Kettle进行数据导入与导出的方法
主要仪器设备: 计算机、Kettle(PDI)、MySQL数据库

某连锁超市为了优化经营管理,拟搭建一个商务智能系统,来帮助企业管理团队更全面、专业的通过数据了解业务况状。目前公司有一个订单数据库,记录了每一笔订单的详细数据,包括以下字段:

【字段名称,订单编号,下单日期,销售点,支付方式,发货日期,物流时限,客户编号,客户名称,客户类型,客户城市,客户省份,客户地区,产品编号,产品名称,产品分类,产品细类,金额,数量,折扣,利润,推销员,是否退货,财政年度】

然而,各部门对数据的关注点不同,且各部门使用数据分析工具对数据的格式要求也不一样。因此,公司委托你开发一个数据转换系统,将订单数据库中的数据按照不同部门的需求进行转换和输出。各部门具体需求如下:

部门名称销售部门物流部门客户关系部门仓储部门售后部门
输出字段订单编号;销售点;支付方式;金额;数量;折扣;利润;推销员订单编号;下单日期;发货日期;物流时限订单编号;客户编号;客户名称;客户类型;客户城市;客户省份;客户地区订单编号;产品编号;产品名称;产品分类;产品细类订单编号;产品编号;客户编号;是否退货;金额
数据格式.xlsx文件.json文件.csv文件.xml文件数据库表
命名规则文件名:姓名拼音文件名:姓名拼音文件名:姓名拼音文件名:姓名拼音数据库表名:return
输出路径输出文件路径为转换文件的当前目录
特殊要求工作表名: 中文姓名所有数据放到1个文件中以逗号作为分隔符以’订单编号’作为节点属性,其它字段作为节点内容只导出[是否退货=1]的数据数据库表自行创建

任务一:搭建KETTLE项目开发环境
(1)在MySQL中创建kettledb数据库和orders表结构及数据
(2)在KTR中创建kettledb数据库连接, 数据库连接参数使用变量(命名参数)
任务二:销售数据导入和导出
(1)需提供转换步骤设计全图
(2)需提供主要转换步骤的关键配置项截图
(3)需提供新建数据库表的SQL语句或操作界面截图
(4)需提供转换执行结果截图
需提供输出的文件/数据库表内容的截图

二、任务一解答

1. 在MySQL中创建kettledb数据库和orders表结构及数据

利用Navicat连接数据库:

订单sql语句:见百度网盘:链接:[https://pan.baidu.com/s/1NbiWzWdm0EfCHBsLn3ucFA]
提取码:12ws

在这里插入图片描述

2. 在KETTLE SPOON中创建转换工程(KTR), 转换名称为个人姓名

利用spoon软件进行创建数据库连接:
在这里插入图片描述

任务二解答

1.转换设计全图

在这里插入图片描述

2. 销售数据表

表输入部分:
输入sql筛选语句:
在这里插入图片描述
表输出部分:
在这里插入图片描述
输出结果:
在这里插入图片描述

3. 物流部门数据表

表输入部分:
在这里插入图片描述
表输出部分:
在这里插入图片描述
输出结果:
在这里插入图片描述

4. 客户关系部门数据表

表输入部分:
在这里插入图片描述
表输出部分:
在这里插入图片描述
内容字段部分:
在这里插入图片描述
在这里插入图片描述
输出结果:
在这里插入图片描述

5. 仓储部门数据表

表输入部分:
在这里插入图片描述
表输出部分:
在这里插入图片描述
内容字段部分:
在这里插入图片描述
在这里插入图片描述
输出结果:
在这里插入图片描述

6. 售后部门数据表

退货表return表在navicat创建:

CREATE TABLE returnb (
  `订单编号` char(14) ,
  `客户编号` varchar(20) ,
  `产品编号` char(14) ,
  `金额` float ,
  `是否退货` tinyint(1) 
);

在这里插入图片描述
退货表数据加载:
输入部分:
在这里插入图片描述
输出部分:
在这里插入图片描述
输出结果:

在这里插入图片描述
输出文件如下:
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值