YinJuan791739156-CSDN博客

原创 Hive系列一（什么是Hive、为什么需要Hive）

通过简单的Hive SQL就能实现统计功能。了解MapReduce编程的都知道，MR程序三板斧：Mapper、Reduce、Driver。本身写代码比较繁琐，而且具有一定的重复工作量。Hive分析数据底层的实现是MapReduce（也可配置为Spark或者Tez）。Hive的本质：Hive是一个Hadoop的客户端，用于将HSQL转换成MR程序。

2023-12-27 10:32:13 416 1

原创 Hadoop系列十（yarn工作机制)

Yarn是一个资源调度平台。负责为运算程序提供相应的运算资源，相当于一个分布式的操作系统平台，而MapReduce是运行再平台上的应用。Yarn主要由ResourceManager、NodeManager、ApplicationMaster、Container等组件构成。

2023-12-27 09:54:09 384 1

原创 Hadoop系列九（MapReduce工作机制）

MapReduce最核心的部分是它的MapTask阶段和ReduceTask阶段。可以简单的理解MapTask阶段用于将一行数据拆分成一个KV的数据，ReduceTask阶段是对Map阶段生成的KV数据做统计。Hadoop的MapReduce的大致流程。

2023-12-26 16:38:54 1311 1

原创 Hadoop系列八（自定义OutputFormat）

try {//获取文件系统对象//用文件系统对象创建两个输出流对应不同的目录@Override//根据一行的log数据是否包含atguigu,判断两条输出流输出的内容} else {@Override//关流@Override//创建一个自定义的RecordWriter返回。

2023-12-26 10:33:42 387 1

原创 Hadoop系列七（Combiner + Shuffle简单理解）

Mapper之后，Reducer之前，Hadoop对数据的操作称为Shuffle。Mapper处理结束的数据，会先存放在环形缓冲区中（内存中）环形缓冲区将内存一分为二，比如预设了环形缓冲区的内存为100M，那么每部分就是50M的内存，mapper向缓冲区写入数据时会先在一个分区内写入数据，当该分区的数据达到80%时，会切换分区，后续所有的数据都写入另外一个分区。数据达到80%的分区会进行一次数据分区，然后对分区内的数据做排序，之后会产生一次数据的溢写，所谓的溢写就是将数据由内存写到磁盘的过程。

2023-12-25 17:27:46 401

原创 Hadoop系列六（Hadoop 排序）

排序是Hadoop的默认行为，不管你是否需要，MapReduce的MapTask和Task都会对输出的结果的Key进行排序，默认的排序顺序是按照字典顺序排列，实现的方法是快速排序。自定义排序需要继承compareTo方法就完成了自定义排序。下面介绍几种排序的场景。

2023-12-25 15:57:54 469

原创 Hadoop系列五（hadoop 序列化与分区）

Data//上行流量//下行流量//总流量//4 实现序列化和反序列化方法,注意顺序一定要保持一致@Override@Override//5 重写ToString@Override。

2023-12-22 16:26:08 459

原创 Hive系列二（Hive 安装与测试）

将下载的 apache-hive-3.1.3-bin.tar.gz 拷贝到 hadoop服务器上 /soft/下。可以在web页面上查看到数据。

2023-12-21 14:44:00 344

原创 Hadoop系列四（hadoop mapreduce 代码+本地测试+集群测试）

参数1：输入文件路径，参数2：最终输出文件夹（文件夹存在会报异常，每次运行都需要将文件夹删除，或者指定一个不存在的文件夹）会在项目路径下多一个target文件夹，jar包就在target文件夹下。将jar包拷贝到hadoop服务器上，每个hadoop节点都需要拷贝一份。将输入文件上传到集群环境的HDFS上。

2023-12-21 10:20:35 498

原创 Hadoop系列三（windows 环境下hadoop hdfs操作）

根据自己hadoop的版本选择对应的依赖。

2023-12-20 14:28:58 474 1

原创 Hadoop系列二（hadoop 集群配置）

可以登录HDFS的web页面查看：http://hadoop100:9870。可以直接在页面查看文件系统的数据。每台服务器都需要修改一下内容。

2023-12-19 15:14:41 473 1

原创 Hadoop系列一（Hadoop 单节点安装）

hostnamectl set-hostname my-hostname 或者编辑 /etc/hosts。ssh localhost 如果提示需要输入密码则执行以下指令。hostname 可以验证修改是否成功。

2023-12-18 17:25:03 349

原创 vue+Element-Plus+Upload+axios多文件同时上传

vue+Element-Plus+Upload+axios多文件同时上传

2023-11-03 15:17:21 1355 1

原创 springboot集成spring.data.redis

spring.data.redis 使用+RedisTemplate bean对象的加载逻辑+自定义RedisTemplate bean对象

2023-10-18 09:38:52 124

原创 springboot-shiro Session/SessionDao/SessionManager/Cache

shiro本身提供了很多场景的sessionmanager，我们这里主要讨论web场景。web场景下的sessionmanager：DefaultWebSessionManager。这里介绍一下sessionmanager。如果对源码不感兴趣，可以跳过本小节。SessionManage 本身是一个接口，定义了start和getSeesion 两个方法。先看一下getSession ，确认一下session 是如何缓存的，又如何取获取session。再次强调一下，这里研究是的web场景。

2023-10-14 22:58:08 235 1

原创 java 线性、4参数（自定义）。。。曲线拟合的简单使用

除了jdk自带的曲线拟合，jdk还提供了自定义的曲线拟合1、实现ParametricUnivariateFunction 接口value方法用于申明函数gradient 则是对函数遍历参数（本例中是a、b、c、d）的求导/*** * 指数函数的求导： f(x) = a^x => f'(x) = a^x * ln(a)* 密函数的求导：f(x) = x^a => f'(x) = a * x^(a-1)

2023-09-12 14:34:11 1709 4

原创 kuboard-spray 安装k8s集群

这里需要注意，版本latest-amd64，不同版本的kuboard-spray能够安装的k8s版本不一样，如果发现版本不匹配，可以卸载重新安装。可以帮助我们快速搭建k8s集群。配置ip，登录密码，etcd节点配置etcd名称，老版本可能还需要配置ssh的信息，新版版直接在全局配置里默认好了，其他配置选择配置。别名、角色配置，要求至少有一个etcd节点，etcd节点数量为奇数，从节点数量必须为奇数，我这里配置了一主一从。资源导入，根据你选定的k8s版本、系统选择合适的资源，yum安装，如果安装过可以忽略。

2023-08-30 10:37:20 362 1

原创 k8s 环境安装

这里说明一下，containerd 、kubelet、kubeadm、kubectl的安装是每个节点都需要的，这个是k8s运行环境，，我们可以拿一台虚拟机安装好上述步骤后，关闭虚拟机，使用vm的克隆拷贝出一个模板主机，这样就可以用这个模板克隆更多的虚拟机，就不需要每个虚拟机都安装一次了。这里选择一主三从的模式，所以需要至少4台虚拟机，这里演示一台linux的配置，其余一样设置，不同的虚拟机只需要别名（hostname）和ip地址不同（但是必须在同一个网段内），k8s 版本使用的是1.27.5-0。

2023-08-28 15:27:17 256

原创 springboot+shiro学习篇（一）

springboot+shiro实现登录与鉴权

2023-06-17 16:41:13 172 1

YinJuan791739156的博客