weixin_39610040
码龄8年
关注
提问 私信
  • 博客:4,445
    社区:2
    问答:180
    4,627
    总访问量
  • 1
    原创
  • 1,517,742
    排名
  • 3
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2017-07-24
博客简介:

weixin_39610040的博客

查看详细资料
个人成就
  • 获得1次点赞
  • 内容获得0次评论
  • 获得4次收藏
创作历程
  • 10篇
    2018年
成就勋章
TA的专栏
  • hive
    7篇
兴趣领域 设置
  • 大数据
    hadoophiveetl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

关于#DolphinScheduler#的问题,如何解决?(标签-分布式|关键词-伪分布式)

发布问题 2023.02.09 ·
3 回答

最新版海豚调度dolphinscheduler 单机版安装后使用浏览器无法打开,如何解决?

发布问题 2023.02.08 ·
1 回答

数据建模和DDM-第二部分.pdf

发布资源 2021.07.13 ·
pdf

数据建模和DDM-第一部分.pdf

发布资源 2021.07.13 ·
pdf

navicat for mysql

发布资源 2019.02.15 ·
rar

1flume原理

Flume 作为 cloudera 开发的实时日志收集系统,受到了业界的认可与广泛应用。Flume 初始的发行版本目前被统称为 Flume OG(original generation),属于 cloudera。但随着 FLume 功能的扩展,Flume OG 代码工程臃肿、核心组件设计不合理、核心配置不标准等缺点暴露出来,尤其是在 Flume OG 的最后一个发行版本 0.94.0 中,日志传输
转载
发布博客 2018.01.19 ·
224 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

单节点flume搭建

1上传文件到root用户下的tmp目录下,然后使用root用户解压[root@h101 tmp]$ tar -zxvf flume-ng-1.2.0-cdh3u5.tar.gz -C /usr/local/授权:chown hadoop.hadoop /usr/local/flume-ng-1.2.0-cdh3u5切换用户: su - hadoop[hadoop@h101 ~]$ vi .bash
转载
发布博客 2018.01.19 ·
292 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive优化

1.hive小文件合并输出合并合并输出小文件。输出时,若是太多小文件,每个小文件会与一个block进行对应,而block存在的意义是为了方便在namenode中存储,那么过多的block将会充斥namenode的表中,待集群规模增大和运行次数增大,那么维护block的表将会过大,严重降低namenode性能。set hive.merge.mapfiles = true #在Map-only的任务结
转载
发布博客 2018.01.19 ·
211 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

分区表和纬度表的创建

1.创建复杂类型的表(array)create table qq1(id int,name string,xingge array)row format delimited fields terminated by ' 'collection items terminated by ',';2.数据源101 zs haha,hehe,heihei102 ls haha,gaga,wawa3.载入数
转载
发布博客 2018.01.19 ·
616 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive 数据类型

关系数据库里有表(table),分区,hive里也有这些东西,这些东西在hive技术里称为hive的数据模型。今天本文介绍hive的数据类型,数据模型以及文件存储格式。这些知识大家可以类比关系数据库的相关知识。  首先我要讲讲hive的数据类型。  Hive支持两种数据类型,一类叫原子数据类型,一类叫复杂数据类型。  原子数据类型包括数值型、布尔型和字符串类型,具体如下表所示:基本数据类型类型描述
转载
发布博客 2018.01.19 ·
956 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

shell常见脚本

-e filename 如果 filename存在,则为真-d filename 如果 filename为目录,则为真-f filename 如果 filename为常规文件,则为真-L filename 如果 filename为符号链接,则为真-r filename 如果 filename可读,则为真-w filename 如果 filename可写,则为真-x filename 如果 file
转载
发布博客 2018.01.19 ·
464 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

hive_sql

进入hive shell#hive或者hive --service cliHive 的启动方式:hive  命令行模式,直接输入/hive/bin/hive的执行程序,或者输入 hive –service clihive  web界面的启动方式,hive –service hwi  hive  远程服务 (端口号10000) 启动方式,hive --service hiveserverhive  
转载
发布博客 2018.01.19 ·
699 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

2、hive导入、导出、删除

一、Hive的几种常见的数据导入方式(插入过程中,不做源数据检测,即:什么数据都可以插入,只是查询时会报空值)这里介绍四种:(1)从本地文件系统中导入数据到Hive表;(2)从HDFS上导入数据到Hive表;(3)从别的表中查询出相应的数据并导入到Hive表中;(4)在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中[hadoop@h91 hive-0.9.0-bin]$ bin/h
转载
发布博客 2018.01.19 ·
362 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

3、hive函数大全

一、关系运算:1. 等值比较: =语法:A=B操作类型:所有基本类型描述: 如果表达式A与表达式B相等,则为TRUE;否则为FALSE举例:hive>select 1 from lxw_dual where 1=1;12. 不等值比较: 语法: A 操作类型: 所有基本类型描述: 如果表达式A为NULL,或者表达式B为NULL,返回NULL;如果表达式A与表达式B不相等,则为TRUE;否则为FAL
转载
发布博客 2018.01.19 ·
295 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

1、hive安装

1.hive只需要安装在 hadoop主节点上root用户安装,并授权2.[root@h91 ~]# vi /etc/profile(需要reboot重启虚拟机)或者可以 [hadoop@h91 ~]$ vi .bash_profile (切换用户再切换回来即可)添加export HIVE_HOME=/usr/local/hive-0.7.1-cdh3u5export HADOOP_HOME=/u
原创
发布博客 2018.01.19 ·
318 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多