qinsur-CSDN博客

原创 hadoop 集群配置（高可用）

hadoop集群高可用配置三台虚拟机先配置jdk和zookeeper配置hadoop配置三台虚拟机192.168.199.161 pass1192.168.199.162 pass2192.168.199.163 pass3先配置jdk和zookeeper见 jdk、zookeeper环境配置配置hadoop解压hadoop安装包[root@pass1 install]# tar -zxvf ./hadoop-2.6.0-cdh5.14.2.tar.gz -C ../

2020-06-08 14:59:56 1368 1

原创 hadoop+zookeeper+kafka集群搭建

hadoop+zookeeper+kafka集群搭建创建四台虚拟机分别在四台虚拟机中编辑ip地址重启网络并ping通www.baidu.com、关闭防火墙四台虚拟机分别修改hostname编辑/etc/hosts创建文件夹，并导入安装包密钥pass1(234),pass2(134),pass3(124)集群环境编辑脚本，在root目录下创建bin文件夹jdk安装hadoop配置创建四台虚拟机192.168.199.161 pass1192.168.199.162 pass2192.168.199.1

2020-06-03 19:39:43 946

原创 Spark 常见算子总结

Spark常见的算子）[root@zjw3 ~]# spark-shellSpark context Web UI available at http://zjw3:4040Spark context available as ‘sc’ (master = local[*], app id = local-1588002167755).Spark session available as ‘spark’.Welcome to____ __/ / ___ / /\

2020-06-02 17:47:06 468

原创 Spark 安装（单机版）

Spark 安装（单机版）解压文件到指定目录修改配置文件重命名到/spark240/conf目录下（1）saprk-env.sh（2）slaves （配置单机的话，则不需要配置）配置环境变量运行Spark (已经安装了 scala)先启动 Hadoop启动 SparkSpark 使用 Python 开发配置python环境安装Python启动PySpark的客户端注意：安装spark之前要安装jdk，hadoop解压文件到指定目录[root@cai install]# tar -zxvf spark-

2020-06-01 20:16:40 623

原创 Zepplin 安装

Zepplin 安装一下载安装包二上传并解压三修改配置文件conf 文件夹下vi zeppelin-env.sh四启动zeppelin五配置hive解释器5.1 环境和变量配置（1）拷贝hive的配置文件hive-site.xml到zeppelin-0.8.1-bin-all/conf下。（2）拷贝jar包5.2 在web界面配置集成hive（1）右上角anonymous --> interpreter --> +Create新建一个叫做hive的集成环境（2）设置propertie

2020-06-01 20:03:06 509

原创 Hive 窗口函数

Hive 窗口函数简介概念数据准备实例聚合函数+overpartition by子句order by子句window子句窗口函数中的序列函数NTILELAG和LEAD函数first_value和last_value扩展：总结：简介本文主要介绍hive中的窗口函数.hive中的窗口函数和sql中的窗口函数相类似,都是用来做一些数据分析类的工作,一般用于olap分析（在线分析处理）。概念我们都知道在sql中有一类函数叫做聚合函数,例如sum()、avg()、max()等等,这类函数可以将多行数据按照规.

2020-06-01 19:45:25 235

Qinsurpass的博客

原创 hadoop 集群配置（高可用）

原创 hadoop+zookeeper+kafka集群搭建

原创 Spark 常见算子总结

原创 Spark 安装（单机版）

原创 Zepplin 安装

原创 Hive 窗口函数

原创 Hive环境搭建

原创用Docker搭建MySQL服务

转载 Linux ~之 Docker 安装与使用

原创 Hadoop：安装（单机及集群）的配置

原创 Flume 三：监测目录写入日志

空空如也

空空如也