hadoop生态圈(待续)
远方蝶翼天涯
硕士,发表数篇核心论文。资深毕业论文和期刊论文辅导专家,辅导七年,百分百通过率
展开
-
sparkRDD
pythonfrom pyspark import SparkConf, SparkContext #创建SparkConf和SparkContextconf = SparkConf().setMaster("local").setAppName("lichao-wordcount")sc = SparkContext(conf=conf) #输入的数据data=["hello",...原创 2020-03-05 16:43:00 · 183 阅读 · 0 评论 -
Hive使用总结
为分隔符为逗号的txt转成表1.txt文件内容如下步骤一:create table t_t2(id int,name string,age int) row format delimited fields terminated by ',';如下:移入文件到hadoop的t_t2中分区管理本地文件夹hivedata中有1.txt和2.txt1.txt的内容2.txt的内...原创 2020-02-04 12:19:58 · 252 阅读 · 0 评论 -
关于HDFS的总结
1、导包,将从官网中下载的解压,提取里面的jar导入eclipse,并Add to bulid path。2、api文档3、结果4、在客户端设定的参数只对客户端的传递起作用4、启动一台linux时,无任何进程,向指定集群传数据时,可修改core.xml文件...原创 2019-07-01 20:47:15 · 329 阅读 · 0 评论 -
HIVE配置总结
一、客户端与服务器1、前台运行(服务端)执行某个hive处于bin/hiveserver2(客户端)另一个电脑 !connect jdbc:hive2://hadoop15:10000 (hadoop15是传集群的那台计算机)2、后台运行nohub bin/hiveserver2 1>/dev/null 2>&1 & (1代表正确的,2代表错误。信息都写...原创 2019-07-16 18:05:04 · 252 阅读 · 0 评论 -
关于zookeeper
zookeeper的作用1、一般情况下,当从机宕了一台,整个集群仍然可以使用,当主机宕机了,整个集群便不可用了,zookeeper可以解决当主机宕机的时候,其他机可以选举产生主机三台电脑装了zookeerperhadoop11hadoop12hadoop13主机宕了,其他两台产生一个主机启动zookeeper,在hadoop14上启动spark在hadoop16上运行spark的...原创 2019-07-17 15:05:52 · 174 阅读 · 0 评论