自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Spark安装及部署

​ 说明2:Hive任务最终由Spark来执行,Spark任务资源分配由Yarn来调度,该任务有可能被分配到集群的任何一个节点。hadoop102的**/opt/module/hadoop/etc/hadoop/capacity-scheduler.xml**​ 说明1:采用Spark纯净版jar包,不包含hadoop和hive相关依赖,能避免依赖冲突。修改 hive-env.sh,将 Hive 堆内存改为 2048M,如下。添加如下内容(在执行任务时,会根据如下参数执行)。

2023-10-11 15:56:38 575

原创 Hive安装及环境搭建

注意:主机名需要改为metastore服务所在节点,端口号无需修改,metastore服务的默认端口就是9083。在yarn-site.xml中关闭虚拟内存检查(虚拟内存校验,如果已经关闭了,就不需要配了)。修改配置文件core-site.xml,然后记得分发三台机器。在hive-site.xml文件中添加如下配置信息。​ 修改后。

2023-10-11 15:56:18 83

原创 MySql安装及部署

说明:由于阿里云服务器安装的是Linux最小系统版,没有如下工具,所以需要安装。rm -rf * (注意敲击命令的位置)

2023-10-11 15:55:38 190

原创 Flume安装及部署

【代码】Flume安装及部署。

2023-10-11 15:54:33 120

原创 Kafka的安装及部署

停止Kafka集群时,一定要等Kafka所有节点进程全部停止后再停止Zookeeper集群。因为Zookeeper集群当中记录着Kafka集群相关信息,Zookeeper集群一旦先停止,Kafka集群就没有办法再获取停止进程的信息,只能手动杀死Kafka进程了。5)修改分区数 (注意:分区数只能增加,不能减少)1)查看操作主题命令参数。4)查看某个主题详情。

2023-10-11 15:53:25 273

原创 Zookeeper安装及环境搭建

(注意:上下不要有空行,左右不要有空格)

2023-10-11 15:52:57 133

原创 Hadoop(HA)

Hadoop(HA)环境搭建1)修改ip和主机名映射<1>修改ip地址(仅限物理机)vim /etc/sysconfig/network-scripts/ifcfg-ens33DEVICE=ens33TYPE=EthernetONBOOT=yesBOOTPROTO=staticNAME="ens33"#根据网络实际情况更改IPADDR=192.168.10.102PREFIX=24GATEWAY=192.168.10.2DNS1=192.168.10.22)安装JD

2023-10-11 15:15:37 29

原创 MapReduce流程优化

通过自定义类继承Partitioner接口,重写方法,可以实现数据自定义分流,减少ReduceTask压力。

2023-07-22 23:11:46 72

DataX配置文件生成器

DataX配置文件生成器

2023-10-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除