hadoop
文章平均质量分 93
花纵酒
这个作者很懒,什么都没留下…
展开
-
关于Cloudera的技巧汇总(更新中)
Cloudera | The Hybrid Data Cloud Company原创 2021-10-10 11:20:44 · 166 阅读 · 0 评论 -
Cloudera QuickStart VM已经过去
参考地址:https://docs.cloudera.com/documentation/enterprise/5-14-x/topics/cloudera_quickstart_vm.htmlCloudera QuickStart VMs are not accessible any longer. You can use the trial version of CDP Private Cloud Base instead. To download, seeCDP Private Cloud Tr.原创 2020-12-02 14:33:14 · 188 阅读 · 0 评论 -
pyspark出现Java.io.IOException: Cannot run program "python": CreateProcess error=2问题的解决办法
Java.io.IOException: Cannot run program "python": CreateProcess error=2解决办法:在ubuntu用户系统配置文件.bashrc中加入:export PYSPARK_PYTHON=/usr/bin/python 同步所有spark的集群中的机器该配置source .bashrc使生生效...原创 2018-09-05 11:30:03 · 13205 阅读 · 2 评论 -
centos7.4下离线安装CDH5.14
博客园 首页 新随笔 联系 管理 订阅随笔- 13 文章- 0 评论- 0centos7.4下离线安装CDH5.14(一)安装前的规划(1)操作系统版本:centos7.4(64bit)[root@hadoop22 etc]# more /etc/centos-releaseCentOS Linux release 7.4.1708 (Core)...转载 2019-03-22 15:20:07 · 252 阅读 · 0 评论 -
hadoop-基本笔记
什么是大数据基本概念在互联网技术发展到现今阶段,大量日常、工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前的传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的软件工具应运而生,这就是大数据!换个角度说,大数据是:有海量的数据 有对海量数据进行挖掘的需求 有对海量数据进行挖掘的软件工具(hadoop、spark、storm、f...原创 2019-04-12 20:35:27 · 233 阅读 · 0 评论 -
hadoop配置文件,绝对可用, hadoop-env.sh、core-site.xml、 hdfs-site.xml、mapred-site.xml、yarn-site.xml、masters
hadoop-env.shexport JAVA_HOME=/home/hduser/jdkcore-site.xml<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://master:9000</va...原创 2019-04-12 22:58:19 · 1579 阅读 · 0 评论 -
CentOS7下完全离线安装CDH6集群
文件下载首先一些安装CDH6集群的必须文件要先在外网环境先下载好。Cloudera Manager 6.0.1CM6 RPM:https://archive.cloudera.com/cm6/6.0.1/redhat7/yum/RPMS/x86_64/需要下载该链接下的所有RPM文件,由于jdk1.8我在环境准备部分已经手动安装了,所以可以不用下载RPMS/x86_64/目录下的jd...原创 2019-05-14 08:41:59 · 3626 阅读 · 1 评论