awys19931001
码龄10年
关注
提问 私信
  • 博客:1,920
    1,920
    总访问量
  • 暂无
    原创
  • 634,802
    排名
  • 0
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖北省
  • 加入CSDN时间: 2014-11-23
博客简介:

awys19931001的博客

查看详细资料
  • 原力等级
    当前等级
    0
    当前总分
    0
    当月
    0
个人成就
  • 获得1次点赞
  • 内容获得0次评论
  • 获得2次收藏
创作历程
  • 6篇
    2019年
成就勋章
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

大数据--hive分桶查询&&压缩方式

一、分桶及抽样查询1、分桶表创建---------------------------------------hive (db_test)> create table stu_buck(id int,name string) > clustered by(id) > into 4 buckets ...
转载
发布博客 2019.10.03 ·
365 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据--hive文件存储格式

一、hive文件存储格式Hive支持的存储数的格式主要有:TEXTFILE、SEQUENCEFILE、ORC、PARQUET。上图左边为逻辑表,右边第一个为行式存储,第二个为列式存储。行存储的特点:查询满足条件的一整行数据的时候,列存储则需要去每个聚集的字段找到对应的每个列的值,行存储只需要找到其中一个值,其余的值都在相邻地方,所以此时行存储查询的速...
转载
发布博客 2019.10.03 ·
281 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据--hiveDML命令操作

1、分区表管理1.1、创建分区表hive (db_test)> create table dept_partition(deptno int, dname string, loc string) > partitioned by(month string) > row format delimited fiel...
转载
发布博客 2019.09.14 ·
241 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

大数据--hive查询

一、全表查询和特定列查询1、全表查询:-------------------------------------------------------------------hive (db_test)> select * from dept;OKdept.deptno dept.dname dept.loc10 ACCOUNTING 170020 RESEARCH 18...
转载
发布博客 2019.09.30 ·
464 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据--hiveDDL命令操作

1、在hive中显示当前数据库的名字和表头的信息,需要在$HIVE_HOME/conf目录下的hive-site.xml文件中添加如下内容:<property><name>hive.cli.print.header</name><value>true</value></property>&l...
转载
发布博客 2019.09.11 ·
308 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

大数据--mapreduce作业提交源码

MapReduce作业提交查看源码1、判断job的状态//将private Job.JobState state的值修改为DEFINE,然后执行submit()方法;public boolean waitForCompletion(boolean verbose) throws IOException, InterruptedException, ClassNotFoundE...
转载
发布博客 2019.08.30 ·
262 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏