自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(66)
  • 收藏
  • 关注

原创 HIVE每日一题

为什么结果没有顺序排序。

2024-06-29 16:26:44 252

原创 hive的联表

hive的三表联表

2024-06-09 20:20:05 124 1

原创 Hive笔记group by 注意点。

group by

2024-06-09 20:12:17 246 1

原创 Hive的Sort by Order by Distribute by Cluster by

区分每个功能使用细节

2024-05-27 19:15:14 383

原创 Hive操作

基本操作

2024-05-27 18:45:54 236

原创 ClickHouse知识点

ClickHouse知识点

2024-05-23 16:44:19 673

原创 ClickHouse课件

ClickHouse基础知识

2024-05-23 16:42:37 1048

原创 Kafka重点笔记

kafka的topic ,分区 等概念

2024-04-22 18:58:35 464 1

原创 Scala 复习笔记

复习Scala时的内容

2024-04-18 19:23:37 353

原创 Scala 集合的灵活使用 -Day7

集合的各种方法和元组

2024-04-18 19:22:06 84 1

原创 Scala之List

List

2024-04-16 19:26:41 1050 3

原创 Scala 之数组

可变\不可变数组 ,二维数组

2024-04-16 19:21:22 517

原创 Scala之面向对象 Day -3

简述了类和对象,包和包对象,封装,继承 和多态

2024-04-15 19:22:17 1140 1

原创 如果你在IDEA中输入String时需要切换大写。请看这里!

IDEA使用技巧

2024-04-15 18:38:03 195

原创 设计模式之单例模式

设计模式(design pattern):针对软件开发过程中的某一类问题形成的方案。到目前为止,在软件开发过程中,有上百种设计模式,其中比较常用的有24种。单例模式(Singleton)是设计模式中最常见、最简单的模式之一 ,属于构建/建造型模式。单例模式,顾名思义,指的是在全局只存在唯一的一个实例对象。双重锁(DCL - Double Check Lock)

2024-04-13 15:38:02 1128

原创 Scala之函数Day-2

简述了Scala中函数的定义,调用以及函数式编程的高阶函数

2024-04-11 17:00:44 1226 1

原创 Scala零基础入门笔记-Day1

简述Scala概述、标识符、数据类型、运算符和分支循环结构

2024-04-10 19:18:35 917

原创 Day3-HBase重要概念

简述Hbase的读写流程、HRegion和HRegionServer、分裂策略。

2024-04-07 15:41:10 625

原创 Day4-Hive直播行业基础笔试题

结果按创作者ID、总粉丝量升序排序。

2024-04-06 20:00:27 879

原创 Day3-struct类型、列转行、行转列、函数

简述了struct类型,正则的捕获组,常用函数、窗口函数及自定义函数。列转行以及行转列

2024-04-05 21:59:32 1335

原创 Day2-Hive的多字段分区,分桶和数据类型

简述Hive的多字段分区(如省市县),分桶(用于对数据随机抽样检测),常用数据类型(timyint,smallint,int,bigint,floot,double,string,binary,map)

2024-04-04 21:42:32 1457

原创 JavaAPI操作HBase-Day2

使用Java代码实现HBase的新增,查询,删除命名空间以及表数据的CRUD。

2024-04-03 17:14:14 818

原创 HBase基础必备知识-Day1

简述了RowKEy、Column Famliy、Version、NameSpace以及常用命令等内容

2024-04-02 19:13:54 791

原创 Day5-Hive的结构和优化、数据文件存储格式

简述 order by 、sort by ;hive存储文件格式、hive设计结构、hive优化

2024-04-01 19:03:32 1147

原创 Day1 - Hive基础知识

hive对数据库数据表的基本命令、内外部表、静态动态分桶

2024-03-31 22:19:50 1445 1

原创 面试题1(京东)之HiveSql --- 难度:入门初级

基础题目,考察窗口函数

2024-03-30 16:10:11 1019

原创 3-zookeeper之ZAB协议

简述了2PC和Paxos算法,分布式中的CAP理论及原子广播

2024-03-29 19:23:45 1656

原创 2-HDFS常用命令及上传下载流程

简述了NameNode的安全模式,SecondaryNameNode,DataNode,机架及副本感知策略,客户端上传下载文件的流程,及分布式中重要的RPC请求

2024-03-28 19:17:15 1621

原创 二手房大数据项目简介

大数据二手房项目

2024-03-27 17:31:39 2713 6

原创 3-Flume之拦截器与GangLia监控

实际过程中,可以使用Ganglia监控Flume的数据流。Ganglia是Berkeley发起的一个开源的集群监控项目,可以检测数以千计的节点的性能Ganglia包含三个模块gmond(Ganglia Monitoring Daemon):轻量级的监控服务,需要监控哪一个节点的性能,就在这个节点上安装gmond服务,可以监控当前节点(系统)的各种指标数据:CPU、内存、磁盘、网络等信息。

2024-03-26 18:46:44 1200

原创 2-Flume之Sink与Channel

自定义Sink的时候,需要定义一个类继承,实现Sink接口,最好还要实现接口来获取配置。注意,自定义Sink的过程中,需要关注事务问题。依赖和笔记1中用的一样。//打印流,打印到文件或者Flume的窗口。sout调用的就是这个类中的方法@Override//从flume中的格式文件中获取路径信息@Overrideif(!Event e;

2024-03-25 18:53:57 1314

原创 笔记1-Hadoop之HDFS的NameNode

开源版本的HADOOP和其他框架的对应关系很混乱,要注意。Hadoop四大模块:Common HDFS MapReduce YarnHadoop能对大量的数据进行分布式处理,可以轻松的从一台服务器扩展到千台服务器,并且 每一台服务器都能进行本地计算和存储。Hadoop还提供了用于处理和探测异常的机制。

2024-03-23 16:14:31 1284

原创 0-Flume(1.11.0版本)在Linux(Centos7.9版本)的安装(含Flume的安装包)

需要注意的是,从Flume1.10.0版本开始,Flume将log4j 1.x替换为了log4j 2.x,因此导致输出数据的时候,默认是将数据写到。Flume本身是由Java开发的,所以需要服务器上安装好JDK1.8(注意区分Linux还是Windows系统的JDk)。一些官网和github上给的是源码,需要自己根据自己的操作系统手动编译为软件,较为复杂。文件中,但是学习过程中,希望数据能够直观展现(打印到控制台上),所以需要修改配置。#首先确认自己的Linux是Centos版本,运行命令。

2024-03-21 18:20:23 748

原创 1-Flume中agent的source

/ 自定义代码实现Sequence Generator Source,加深理解 public class AuthDrivenSource extends AbstractSource implements EventDrivenSource , Configurable {// 获取参数值 @Override public void configure(Context context) {

2024-03-21 17:59:48 1204

原创 大数据培训之Zookeeper零基础-1

在大数据中,几乎所有的框架,它的安装都提供了三种模式单机模式:在一台服务器上安装,往往能够启动这个框架的部分服务伪分布式:在一台服务器上安装,但是利用多个线程模式分布式环境,能够启动这个框架的大部分甚至于服务分布式:在集群上安装,能够启动这个框架的所有服务现阶段,先安装单机模式,搞定所有的概念之后,再到集群中安装。

2024-03-05 14:34:12 1038

原创 Linux笔记-2

默认情况下,虚拟机和笔记本一样,采用的都是动态IP - 每次联网都会在当前网段内随机分配一个IP实际过程中,虚拟机一般需要自己固定静态IP步骤查看网络编辑器中VMnet8对应的网段编辑文件修改属性在文件末尾添加重启网络查看ifconfig测试能否连接外网。

2024-03-04 18:37:30 956

原创 Linux笔记-3

Shell是一个命令解释器,接收用户/程序的操作/指令,然后将指令解析之后交给操作系统的内核来执行Shell本身也可以看作是一门编程语言,相对易于书写,灵活性很强Linux中提供了Shell解析器sh是bash的软链接,所以执行sh和使用bash的效果是相同的Centos中默认使用的是/bin/bash。

2024-03-04 18:36:36 901

原创 Linux笔记-1

linux基础

2024-03-01 19:30:33 1096

原创 找出长字符串中短字符串的个数

【代码】找出长字符串中短字符串的个数。

2024-02-19 11:15:19 526

原创 java编程之学生成绩管理系统

【代码】java编程之学生成绩管理系统。

2024-02-05 15:02:08 747

0-Flume(1.11.0版本)在Linux(Centos7.9版本)的安装

0-Flume(1.11.0版本)在Linux(Centos7.9版本)的安装

2024-03-21

mysql基础知识总结,零基础必看

基础知识总结

2024-02-05

前端后端和数据库代码资源

前端后端和数据库代码资源

2024-01-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除