龟速扣代码-CSDN博客

分布式：指的是数据库是分布式的，不是集中在一个地方的。所以数据库分为本地库和远程库。step2：进入目录后，打开git bash。执行命令 git clone 远程库地址(HTTP地址或SSH地址)。数据库：存储版本信息的地方就叫做数据库，里面记录的是文件或目录状态的地方，存储内容修改的历史记录。缓存区(暂存区)：是为了提交工作树的所有改动到本地库做准备的。工作树(工作区)：本地上，在git管理下，大家实际操作的目录。.git 目录上一级的目录。1.1、git init通常用于项目从无到有，即没有远程库。

2023-07-19 21:17:25 1286

原创合并日志树——LSM Tree

LSM树的初解

2023-05-09 14:39:28 1282

原创 Mysql事务机制

mysql的事务，事务特性，事务隔离等级。

2022-11-28 16:07:01 755

原创 kudu集群数据节点(tserver)扩容(缩容)

kudu的数据节点数量变化, 扩容，缩容

2022-11-17 17:04:11 1403

原创 clickhouse使用clickhouse-keeper代替zookeeper

clickhouse进入只读模式，使用clickhouse-keeper代替zookeeper

2022-11-17 16:14:35 6394

原创 Hive常见的计算(连续纸，topN，行专列，列转行)

hive 面试sql 连续值 topN 行转列列转行 json解析 jsont_uple get_json_object

2022-05-24 02:54:57 2083

原创使用Ip2Region将IP值转换为地址(impala，spark)

ip转换省份，城市， ip2regionimpala， sparksql，自定义udf，spark

2022-05-10 17:47:10 1627

原创 MapReduce的启动流程，源码阅读

MapReduce的启动过程，MR的输入和输出的格式类和路劲检查，切片逻辑，application临时目录构建，

2022-05-08 23:03:12 1066

原创实时采集Canal快速入门

CDC, 实时采集，实时同步，canal，kafka，入门实例

2022-04-26 14:27:07 5532

原创 Scala计算时间，向前向后推一段时间

def getStartTime(nowdate: String, delay: String): String={ val format = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss") val fr = new java.text.SimpleDateFormat("yyyy-MM-dd HH:mm:ss") var mdate = "" val d = fr.parse(nowdate) val myTime = (.

2022-04-24 11:53:38 462

原创 Kafka主题的管理操作

kafka的主题 topic的操作，增删改查

2021-12-29 23:13:21 1027

原创 centos上的kafka集群搭建

kafka在linux centos的集群安装部署

2021-12-14 23:05:15 1689

原创大数据学习之组件安装

大数据学习简介及组件部署安装文档指导

2021-11-26 09:51:42 1434

原创 HBase的安装部署

HBase安装部署学习Hbase工作原理 shell命令和API 的使用

2021-11-25 14:53:28 2051

原创 Hadoop的安装部署(学习使用)

大数据学习 hadoop yarn HDFS

2021-11-24 00:07:07 1950

原创 Zookeeper集群搭建

zookeeper集群部署

2021-11-21 21:51:15 669

原创 Hive的时间函数

1- 获取当前日期，得到 yyyy-mm-dd格式select current_date;2- 获得当前时间的时间戳select unix_timestamp();3- 时间戳和日期的相互转换。 from_unixtime 和 unix_timestamp 3.1-- from_unixtime -时间戳(13位) 转日期-- 默认日期格式是 yyyy-mm-dd HH:MM:ssselect from_unixtime(1637232609);...

2021-11-18 19:09:27 3656

原创 Window查看服务是哪个进程，并强制kill(发现端口或者文件被占用)

window 删除文件被占用命令行端口号 kill 进程

2021-11-18 18:26:20 1214

原创用VM虚拟机搭建大数据学习集群(3节点)

vm虚拟机集群，静态IP，关闭防火墙，免密登录，集群同步时间。同步脚本宿主机hosts文件

2021-11-17 23:19:56 4554

原创 1-docker架构

docker是一种容器技术。容器是一种轻量级，可移植，自包含的软件打包技术。解决不同服务需要不同的环境它采取的是client/server架构，主要有是三个组件(client，daemon，registry)，两个概念(image和container)三个组件：client端：最常见的是 docker命令daemon：服务器端，以linux后台服务形式运行。负责创建，运行，监控容器；构建存储镜像。默认是相应本地host的请求，如果需要远程，需要配置registry：是存放im

2021-11-09 15:27:27 139

原创 Hive安装部署

前提: 安装了 hadoop(提供数据的存储HDFS) 和 mysql (作为hive的元数据库)。mysql新建了hive的用户。用户名为 hive ，密码为 "12345678"官网下载安装包 Index of /dist/hive 。以hive-2.3.7为例解压缩安装包以安装目录为 /opt/cluster/servers 为例， cd /opt/cluster/servers/tar zxvf apache-hive-2.3.7-bin.tar.gz -C ..

2021-11-06 20:17:00 2426 7

原创 Canal-adapt部署遇到的小坑-java.lang.IllegalArgumentException: Could not resolve placeholder ‘GROUP[1]‘ in v

背景: 使用 canal+ kafka + canal-adapt。将源数据库mysql0 实时同步到目的数据库mysql2。数据流向 Mysql0 -> canal -> kafka -> canal-adapt -> Mysql2按照官网的demo步骤进行配置。后运行报错2021-10-25 19:45:16.358 [Thread-2] ERROR c.a.o.canal.adapter.launcher.loader.CanalAdapterLoade.

2021-11-04 12:08:55 897

原创 FlinkCDC同步mysql的demo

<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/ma.

2021-09-17 17:07:52 8618 19

原创 linux安装 mysql5.6，遇到Please configure the ‘hostname‘ command to return a correcthostname.

今天需要在linux安装个mysql用于测试，在网上找个教程便开始安装前面的下载，解压，重命名文件夹，添加用户，用户组都不会有啥问题，我的mysql的解压安装路径是 /root/xxx/mysql，没有按照教程的解压安装路径。groupadd mysqluseradd -r -g mysql mysql然后按照教程修改 /etc/my.cnf添加了basedir=/usr/local/mysqldatadir=/usr/local/mysql/databasedir=/usr/.

2021-09-08 11:34:35 1331

原创 window下的kafka安装部署，命令练习

1- 前期环境准备(mysql，kafka，canal) 1.1- windows下mysql的安装部署 1.2- windows下kafka的安装部署 1.3- windows下canal的安装部署2- Mysql的配置文件配置(开启bin-log)3- kafka的配置文件设置4- canal的配置文件设置5- 测试记录...

2021-08-17 17:14:03 183

原创 Window环境下canal实时同步mysql增量数据到kafka的单机版demo

1- 前期环境准备(mysql，kafka，canal) 1.1- windows下mysql的安装部署 1.2- windows下kafka的安装部署 1.3- windows下canal的安装部署2- Mysql的设置(开启bin-log，创建用户)3- canal的配置文件设置4- 测试记录本文是为了测试canal的基本功能，使用windows操作系统，采用单机模拟实际的集群(kafka和canal)。对比实...

2021-08-17 14:58:03 758

原创吴恩达深度学习-第一课神经网络和深度学习-第2周课后编程

import numpy as npimport matplotlib.pyplot as pltimport h5pyimport scipyfrom PIL import Imagefrom scipy import ndimagefrom lr_utils import load_dataset##第二周的课后编程训练# 1- 介绍了项目中需要的一些库，并导入 numpy，matplotlib.pyplot，h5py, scipy, Image# 2- 加载项目的数据(训练集.

2021-07-25 17:53:09 566

原创吴恩达深度学习-第一课神经网络和深度学习-第二周课后小测

1: What does a neuron compute?(神经元怎么进行计算)A: A neuron computes an activation function followed by a linear function (z = wx + b)，神经元在计算完线性函数 z = wx + b后在进行激活函数计算B: A neuron computes the mean of all features before applying the output to an activation fu

2021-07-25 17:42:35 926 5

CCR对leader性能的影响.doc

sense（beta）插件

空空如也