hadoop
大鹏的NLP博客
擅长自然语言处理,知识图谱,人工智能,大数据,K8S,软件工程等领域的技术及管理
展开
-
Hive使用笔记
Hive的存储是建立在Hadoop文件系统之上的。Hive本身没有专门的数据存储格式,也不能为数据建立索引,用户可以自由地组织Hive中的表,只需要在创建表的时候告诉Hive数据中的列分隔符和行分隔符就可以解析数据了。 Hive中主要包含四类数据模型:表(Table)、外部表(External Table)、分区(Partition)和桶(Bucket)。 Hive中每个分区都对应数据库中相应原创 2016-04-01 17:17:21 · 968 阅读 · 0 评论 -
Hadoop之自定义格式分隔文件测试笔记
通过重写FileInputFormat类下的getSplits方法实现自定义格式分隔文件。XmlInputFormat类package boa.hadoop.xml;import java.io.IOException;import java.util.ArrayList;import java.util.List;import org.apache.hadoop.conf.Configurat原创 2016-01-25 18:46:39 · 880 阅读 · 0 评论 -
hadoop常用命令笔记
查看文件列表: sh hadoop fs -ls -R hdfs://master:9000/output上传文件: sh hadoop fs -put file:///home/dragon1/workspace_develop/input.txt hdfs://master:9000/input.txt显示文件: sh hadoop fs -cat hdfs://maste原创 2016-01-24 10:39:45 · 468 阅读 · 0 评论 -
centos7 64位 伪分布安装cdh5.5.1,及其测试笔记
安装JAVAtar -xvf /opt/java/jdk-8u71-linux-x64.tar.gz /opt/java/jdk1.8.0_71增加环境变量vim /etc/profile 修改profile 最后面加入 export JAVA_HOME=/opt/java/jdk1.8.0_71 export CLASSPATH=.:JAVAHOME/jre/lib/rt.原创 2016-01-21 21:35:36 · 2804 阅读 · 0 评论 -
hadoop:ls: `.': No such file or directory
问题:执行“sudo -u hdfs hadoop fs -ls -R“ 报告错误:“ls: `.’: No such file or directory“ 解决办法:http://stackoverflow.com/questions/28241251/hadoop-fs-ls-results-in-no-such-file-or-directory原创 2016-01-21 21:57:54 · 6606 阅读 · 1 评论 -
配置Oracle VM VirtualBox,实现内外网访问笔记,以进行spark、hadoop集群开发测试
许久不用,忘记,免得再忘,特记之。全局设置 主节点设置: 从节点设置:启动hadoop、spark:从节点1启动情况:从节点2启动情况:原创 2016-01-20 12:33:47 · 1669 阅读 · 0 评论 -
hadoop dremel Caffeine Pregel
Google Dremel 原理 - 如何能3秒分析1PBhttp://www.360doc.com/content/12/0824/15/11586_232093513.shtmlhttp://www.yankay.com/google-dremel-rationale/Google后Hadoop时代的新“三驾马车”——Caffeine、Pregel、Dremelhttp原创 2014-12-05 21:40:04 · 1858 阅读 · 0 评论 -
hadoop2.6伪分布部署笔记
http://blog.csdn.net/hitwengqi/article/details/8008203原创 2014-12-20 20:18:38 · 10935 阅读 · 0 评论 -
Ubuntu 18.10 LTS 下Hadoop 3.1.2 伪分布式模式部署流程
hadoop pseudo distributed mode系统环境No LSB modules are available.Distributor ID: UbuntuDescription: Ubuntu 18.10Release: 18.10Codename: cosmic先决条件jdk-8。jdk-12试过后不可以,缺一些包。sshpdshsudo apt ...原创 2019-03-29 18:18:09 · 741 阅读 · 1 评论