自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 关于如何使用neo4j-admin工具批量导入已处理好的csv数据(neo4j 社区版 5.5)

本文主要解决的问题neo4j的社区版 5.5版本该如何使用neo4j-admin导入数据

2023-04-28 17:25:18 576

原创 kettle实例,最后两个

一、加载演员数据至演员维度表1.创建转换2.配置控件 配置“表输入”控件,单击“新建”按钮,配置数据库连接,如下图:配置“表输入2”控件,如下图:配制“插入/更新”控件,如下图:3.运行转换二、加载电影数据至电影维度表1.创建转换2.配置控件配置转换中的控件,一个一个来,该连数据库就连数据库,需要获取字段就获取字段,按照需求输入文字,具体配置如下(部分连接数据库未截图...

2021-12-01 22:36:31 709

原创 kettle实例

一、加载用户数据至用户维度表1.创建转换 创建转换,如下图:2.配置控件双击“表输入”控件,进入“表输入”配置界面,单击“新建”按钮,配置数据库连接,配置完成后单击“确认”按钮。MySQL数据库连接的配置,如图所示。 完成。进入“表输入2”界面,单击“新建”按钮配置数据库连接,在SQL框中编写SQL语句用于获取最新数据,单击“确定”按钮完成配置,具体配置如下:接下来创建一个子转换(1)创建子转换(2)配置控...

2021-12-01 21:42:52 854

原创 kettle实例1

一、加载日期数据至日期维度表1、创建转换打开kettle,创建转换如图1-1所示。图1-1 创建转换2、配置控件 配置“生成记录”控件,具体配置如图1-2所示。图1-2 配置“生成记录”控件 配置“增加序列”控件,具体配置如图1-3所示。图1-3配置“增加序列”控件配置“Javascript”控件,首先写代码://Script here//生成localevar locale = ...

2021-11-28 20:37:41 962

原创 Kettle 数据加载课后题

一、全量加载 开始前先创建两个数据表,full_sourse和full_target两表,具体内容如下:full_soursecreate table `full_source` ( `no` int (10), `book_name` varchar (60), `author` varchar (30), `tag` varchar (60)); insert into `full_source` (`no`, `book_name`, `author`, `ta...

2021-11-24 12:39:06 736

原创 Kettle_数据转换

本篇主要实现数据力度的转换。 题目是《数据清洗》第六章课后操作题p252.一、实现对文本文件personnel_data.txt中的数据进行数据粒度的转换,即将文本文件personnel_data.txt中字段为household_register的数据统一成省份(直辖市),并输出到文本文件personnel_data_new.txt中。1.创建转换 创建新转换,如下图配置。图1-1 创建转换2.配置控件 “文本文件...

2021-11-21 23:47:57 1173

原创 kettle的基础实例

一、Excel输入 创建新转换,在左侧“核心对象”处选择“表输入”拖入工作台,双击对其进行配置,包括“文件”,“工作表”,“字段”三项,具体配置如图1-2,1-3,1-4所示。图1-1 “Excel输入”控件图1-2 “文件”配置图1-3 “工作表”配置图1-4 “字段”配置 完成后,点击确定。 运行。图1-5 运行成功二、表输入 输入都差不多,先把表输入选入工作台,然后配置,与事先...

2021-11-17 12:33:02 729

原创 使用kettle工具完全去重和缺失值填充

本次实验包括对csv文件的完全去重和对txt文件的的缺失值进行填充。1.完全去重

2021-11-08 15:46:07 2458

原创 Kettle工具实现CSV文件的抽取和JSON文件的数据抽取

使用kettle工具前需要做的准备: 因为本次实验是将CSV文件和JSON文件中的数据保存至数据库的数据表中,所以在此之前需要在数据库中建立一个数据库及两个数据表。 建立数据库、数据表过程如下:mysql -u root -p -- 回车后需要输入你的数据可以密码/*进入MySQL后开始建库建表*/mysql> create database extract; -- 新建一个名为extract的数据库mysql> use extrac...

2021-10-13 20:16:32 667

原创 Kettle的转换与作业

一、转换 转换是ETL解决方案中的主要组成部分之一,主要用于数据的抽取、转换以及加载等操作,其本质是一组图形化的是数据转换配置的逻辑结构。 下面是实现转换的步骤:1、数据准备 创建一个数据库personal,再建表personal_a和personal_b,a表是有数据的,b表是只有表头的空表。(如何建立数据库自己去学,做这个还是得有点数据库基础,冲啊少年)2、创建转换 Kettle是绿色无需安装的软件,首先双击Kettle目录...

2021-10-06 00:00:15 5033

原创 《数据清洗》知识总结------第一章 数据清洗概述

涉及内容:数据清洗的背景/定义/原理/基本流程/策略与方法1.1 数据清洗的背景 数据质量的好坏决定了数据分析与数据挖掘能否获得理想的结果。数据清洗可以提高数据质量,排除干扰,得出有效、可靠的数据,以此支持决策。1.1.1 数据质量概述 数据质量是指在业务环境下,数据符合数据消费者的使用目的,能满足业务场景具体需求的程度。当然,数据质量是一个相对的概念,不同决策者对数据质量的高低要求不同。其显著特点为:“业务要求“会随时间变化,数据质量也会随时间发生变化。 ...

2021-09-13 11:04:02 9747 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除