大数据
黄大仙儿
这个作者很懒,什么都没留下…
展开
-
初识大数据:Hadoop、Spark、Storm
大数据的主要特点:4V数据量大(Volume),数据类别复杂(Variety),数据处理速度快(Velocity)和数据价值高(Value)大数据处理分类:· 复杂的批量数据处理(batch dataprocessing),通常的时间跨度在数十分钟到数小时之间。MapReduce· 基于历史数据的交互式查询(interactivequery)原创 2015-01-22 16:27:56 · 3695 阅读 · 0 评论 -
Eclipse JDBC连接Hive 两种方法 hiveserver hiveserver2
环境:CentOS 6.5, Hadoop2.5.1, Hive0.13.1, 使用mysql作为元数据库(用户名test)安装Hadoop、Hive的过程就不说了,网上一大堆Eclipse创建项目创建java项目:HiveJdbcClientBuild Path->Configure Build Path->Libraries,将下列jar包添加到项目中:$HIVE_HOME原创 2016-03-31 17:20:51 · 4685 阅读 · 1 评论 -
hive批量删除分区 删除时间范围分区
hql:alter table tb_partition drop partition (etl_dt>='20181102',etl_dt<='20181104')原创 2018-12-10 11:08:02 · 26304 阅读 · 4 评论