- 博客(7)
- 收藏
- 关注
原创 linux系统时间和硬件时间的同步解决
1.系统时间和硬件时间不准确影响了程序的一些数据展示2.修改系统时间需要在/etc/sysconfig/clock文件中输入ZONE="America/Los_Angeles"3.在.bash_profile中修改为TZ='Asia/Shanghai';4.source文件source .bash_profile5.执行命令:硬件时间去同步系统时间 hwclock --systohc或者系统时间去同步硬件时间hwclock --hctosys来使两个时间保持一致6.nt
2021-10-25 23:14:28 3180
原创 greenplum单节点最详细完整安装及使用
安装greenplum单机版:安装环境准备1.关闭SELINUXvim /etc/selinux/configSELINUX=disabled2.关闭防火墙systemctl stop firewalld.service #停止防火墙systemctl disable firewalld.service #在开机时禁用服务3....
2020-01-17 18:04:50 4914 3
原创 elasticsearch集群搭建
ES版本:7.5.1服务器三台192.168.9.130192.168.9.131192.168.9.162前提:需要安装java部署ES集群,三台机器同样的操作1、添加普通用户启动esuseradd elasticsearch2、安装ES1)解压缩tar xf elasticsearch-7.5.1.tar.gz -C /opt/module/2)创建文件夹下面配置会指定...
2020-01-13 17:19:12 244
原创 Sqoop:Hadoop生态体系和RDBMS体系之间传送数据的实战
一: Sqoop将数据从关系型数据库导入到大数据平台:首先在本地Mysql中建一个表create table customertest(id int,name varchar(20),last_mod timestamp default current_timestamp on update current_timestamp);往数据库中添加数据insert into custome...
2019-09-13 09:47:17 226
原创 Sqoop:从0到1(简介安装和使用)
Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。Hadoop生态系统包括:HDFS、Hive、Hbase等RDBMS体系包括:Mysql、Oracle、DB2等Sqoop可以理解为:“SQL 到 Hadoop 和 Hadoop 到SQL”。简介之后就到了安装环节配...
2019-09-13 09:47:12 156
原创 导入数据到Hive表中的常用四大方式
查阅资料发现大家往表中添加数据多少有误,在此献上常用的导入方式1.从本地系统向hive表添加数据 : load data local inpath "filePath" into table 表名 ;本质上执行一条: hdfs dfs -put 本地路径 hdfs对应数据表放置的路径(表加载路径下)2.从hdfs向hive表添加数据: ...
2019-09-08 23:30:58 1922
原创 hive中数据存储格式
Hive支持的存储数的格式主要有:TEXTFILE(行式存储) 、SEQUENCEFILE(行式存储)、ORC(列式存储)、PARQUET(列式存储)。1 行式存储和列式存储[外链图片转存失败(img-dOuxrqGC-1567955011190)(assets/1565922054140.png)]上图左边为逻辑表,右边第一个为行式存储,第二个为列式存储。行存储的特点: 查询满足条件的...
2019-09-08 23:09:17 471
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人