hadoop
言蹊
这个作者很懒,什么都没留下…
展开
-
hadoop文件上传,下载
上一节我们搭建好了集群,数据从哪里来呢。通常经过是通过etl工具,如kettle,informatica等将其他系统的数据抽取成文件,然后再利用脚本调用hdfs的命令导入进hdfs集群。还有一种方式是通过通用组件如sqoop等,今天先讲第一种方式。HDFS 常用命令在 Linux 命令行终端,可以使用命令行工具对 HDFS 进行操作。使用这些命令行可以完成 HDFS 文件的上...原创 2020-03-02 14:28:43 · 4742 阅读 · 0 评论 -
hadoop系列——hadoop集群动态扩容、缩容
动态扩容,顾名思义,就是通过增加节点实现集群服务能力的提升。是hadoop,或者说分布式集群的特性之一;同理,部分节点可能老化,升级换代,节点需要对应的下线处理。今天就分别介绍这两部分操作:1,动态扩容1.1,在新增节点配置环境,可以参考Hadoop集群的搭建 里如何配置节点,步骤都是一样的,不在赘述。1.2,在主节点修改hosts文件,增加新增节点[hadoop@serve...原创 2020-03-02 10:25:14 · 3286 阅读 · 1 评论 -
windows下eclipse连接远程hadoop集群的开发配置
1,百度下载eclipse插件hadoop-eclipse-plugin-2.7.3.jar,放入eclipse安装目录下的plugins下,重启eclipse2,配置hadoop在windows下的安装目录windows-->preference-->Hadoop Map/Reduce3,windows-->showview-->others-->Map/Reduc...原创 2018-03-16 16:20:17 · 2592 阅读 · 1 评论 -
hadoop集群搭建
最近为了解决30亿+清单级数据的查询工作,尝试用presto解决。方案1:采用deepgreen, 优化表分布,建立索引方案2:采用hadoop+presto回顾一下hadoop集群的搭建过程:1.1,准备机器10.1.240.183 base018310.1.240.184 base018410.1.240.185 base018510.1.240.186 base018...原创 2018-03-12 13:04:11 · 330 阅读 · 0 评论 -
Hive2.x环境搭建
与 Hadoop 类似,Hive 也有 3 种运行模式: 1. 内嵌模式 将元数据保存在本地内嵌的 Derby 数据库中,这是使用 Hive 最简单的方式。但是这种方式缺点也比较明显,因为一个内嵌的 Derby 数据库每次只能访问一个数据文件,这也就意味着它不支持多会话连接。 2. 本地模式 这种模式是将元数据保存在本地独立的数据库中(一般是 MySQL),这用...原创 2018-03-13 14:45:41 · 572 阅读 · 0 评论