Hadoop的实战

本文介绍了数据准备阶段如何上传到Hive数据库并解决乱码问题,包括Linux与MySQL字符集设置。随后讲述了数据加工,特别是数据清洗的方法,以及使用FineBI进行数据可视化的步骤。
摘要由CSDN通过智能技术生成

步骤:数据准备、数据加工、数据可视化、仪表盘驾驶舱、分享仪表盘

1.数据准备

需要将数据上传到数据库中。先从本地上传到linux系统,在将linux系统中的文件传到数据库(hive)中,在数据库进行分类。

  • 将本地文件上传到linux系统中:可以使用xshell和xftp进行文件互传
  • 将linux文件上传到数据库中:1.需要先创建数据库2.创建好相应格式的表。
  • 把文件上传:
load data local inpath 'linux文件路径' into table 表名 ;

 问题:解决上传数据库乱码问题

--注意 下面sql语句是需要在MySQL中执行  修改Hive存储的元数据信息(metadata)

show variables like 'char%';

use hive;

show tables;



alter table hive.COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

alter table hive.TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

alter table hive.PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8 ;

alter table hive.PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;

alter table hive.INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

--注意 下面是linux的shell命令,在linux终端执行

-- 修改mysql中数据库默认字符集

-- 1)修改配置文件

$ vim /etc/my.cnf

# 在[mysqld]上面添加

[client] 

default-character-set=utf8

# 在[mysqld]下面添加一行:

default-storage-engine=INNODB 

character-set-server=utf8

collation-server=utf8_general_ci

2)重启MySQL服务

$ systemctl restart mysqld

 如果在这些步骤之前已经创建了数据库和表,需要删除后重新建新的数据库。

 2.数据加工

对想要的数据进行加工处理,进行数据清洗

怎么进行数据清洗:

很详细,快去看!!!icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/109413107

例如:

基础数据库命令使用:会创建,修改,查询表。

我之前内容有发。。

 3.进行数据可视化

使用到的工具:FineBI 

网址:https://www.finebi.com/

效果:我们仪表盘做的简单,具体使用要求,美观要求,自行了解,熟悉软件

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值