
数据库
文章平均质量分 90
王亭_666
这个作者很懒,什么都没留下…
展开
-
使用Ckman部署ClickHouse集群介绍
ClickHouse Manager是一个为ClickHouse数据库量身定制的管理工具,它是由擎创科技数据库团队主导研发的一款用来管理和监控ClickHouse集群的可视化运维工具。目前该工具已在github上开源,开源地址为:github.com/housepower/ckman。它通过提供一个直观的图形用户界面(GUI),极大地简化了数据库的管理和操作。这款工具支持多种功能,包括但不限于SQL查询编辑器、数据可视化、实时监控、性能分析、备份与恢复等。原创 2024-07-03 16:10:07 · 1326 阅读 · 0 评论 -
Hudi之数据读写探究
操作类型I/O开销CPU开销写入吞吐量磁盘空间利用内存消耗并发处理能力网络开销INSERT-写入最低几乎无需计算吞吐量较高低低一般低BULK_INSERT-批量写需要更多I/O有一些计算需求吞吐量最高较低较低高低UPSERT-更新或写入最高需要较高的计算资源吞吐量最低高较高低高。原创 2024-05-29 16:40:09 · 2057 阅读 · 0 评论 -
Hudi之TimeLine(时间轴)原理概念
在Apache Hudi中,TimeLine是指,用于跟踪数据湖Hudi中数据的变化历史。TimeLine是Hudi的核心概念之一,用于管理和维护数据湖Hudi中各个数据集的变化历史。具体来说,TimeLine由一系列时间戳(timestamp)和相关的操作事件(如写入、更新、删除)组成,这些事件按时间顺序排列。每个数据集都有自己的TimeLine,用于记录该数据集的变化历史。 通过TimeLine,用户可以追溯数据集的变化历史,了解数据是如何随着时间变化的。原创 2024-05-20 18:01:22 · 1675 阅读 · 0 评论 -
SQL中的CASE WHEN语句:从基础到高级应用指南
SQL中的CASE WHEN语句是一种灵活的条件逻辑工具,用于查询中根据条件生成不同结果。它处理多种条件,可嵌套使用,适用于简单判断到复杂业务规则。无论数据转换还是业务分析,CASE WHEN都是不可或缺的工具。原创 2023-08-30 18:01:27 · 15046 阅读 · 1 评论 -
深入理解窗口函数和使用介绍
想象一家咖啡馆,里面有一堵特殊的墙,我们称之为“洞察之墙”。这堵墙背后有一个魔法窗户,这就是窗口函数。这个窗户可以让你透过它去看到一系列的数据,但是你可以使用特殊的工具,比如望远镜和魔法棒,来查看和分析这些数据。现在,让我们来看看这些工具的具体用途:1. **望远镜 - RANK、DENSE_RANK、ROW_NUMBER:** 想象你站在窗户前,你可以通过使用望远镜,看到墙上的标识。这些标识告诉你每个数据在排序中的位置,就像在一个比赛中知道运动员的排名一样。RANK表示前几名的排名,DENSE_原创 2023-08-23 15:04:53 · 4953 阅读 · 1 评论 -
MySQL实现数据炸裂拆分(类似Hive的explode函数的拆分数组功能)
在Hive中,"explode"函数用于将数组类型的列拆分为多行,以便对数组中的每个元素进行处理。然而,在MySQL中,并没有直接的类似功能。但是,我们可以使用一些技巧来模拟这个功能,实现在MySQL中拆分数组并进行查询的操作。本文将介绍如何在MySQL中实现类似Hive的"explode"函数的拆分数组功能。 场景模拟:假设我们有一个名为`wow_info`的表,其中包含一个包含竖线分隔的数字列表的列`tianfu`,我们希望将每一种天赋拆分为多行进行查询。原创 2023-07-07 10:48:23 · 6755 阅读 · 1 评论 -
阿里开业项目chat2DB-人工智能SQL分析介绍
下载安装包Chat2DB Setup 2.0.1.exe后,直接安装即可,界面非常简洁清晰配置完毕后,使用方式将改变成只需要描写需求即可chat2DB除可以AI智能SQL分析,还可以协助自动生成报表例如,wow_info表中,字段:zhuangbei,代表装备类型,有布甲、皮甲、板甲等等现在想去分析一下每种类型的占比情况在Charts栏中可以选择不同的指标,实现不同维度的数据。原创 2023-07-05 15:57:25 · 4257 阅读 · 1 评论 -
Flink读写Doris操作介绍
Flink Doris Connector 可以支持通过 Flink 操作(读取、插入、修改、删除) Doris 中存储的数据。可以将 Doris 表映射为 DataStream 或者 Table。原创 2023-05-15 10:55:17 · 10441 阅读 · 4 评论 -
Doris的分区Partition和分桶Bucket介绍
Range分区是一种基于分区键对表进行分区的方式,分区键指的是表中的某一列,而Range则是指这个列的值的范围。使用Range分区,可以将数据按照列的值的范围进行划分,将数据分散到不同的节点上,以实现分布式存储和查询分区列通常为时间列,以方便的管理新旧数据Partition 支持通过仅指定上界,系统会将前一个分区的上界作为该分区的下界,生成一个左闭右开的区间。也支持通过指定上下界,生成一个左闭右开的区间当不使用Partition建表时,系统会自动生成一个和表名同名的,全值范围的 Partition。原创 2023-05-12 14:23:30 · 6360 阅读 · 0 评论 -
Doris简介、部署、功能介绍以及架构设计
Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。基于此,Apache Doris 能够较好的满足报表分析、即席查询、统一数仓构建、数据湖联邦查询加速等使用场景,用户可以在此之上构建用户行为分析、AB 实验平台、日志检索分析、用户画像分析、订单分析等应用。原创 2023-05-10 17:34:44 · 50727 阅读 · 0 评论 -
Elasticsearch7从入门到精通(简介、部署、原理、开发、ELK)
Elasticsearch官方网站:https://www.elastic.co/cn/elasticsearch/Elasticsearch是一个基于Lucene的搜索服务器提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Pyt原创 2022-11-04 17:28:00 · 6507 阅读 · 0 评论 -
Redis简介及Redis部署、原理和使用介绍
Redis是当前比较热门的NoSQL框架之一它是一个开源的、使用ANSI C语言编写的key-value存储系统(区别于MySQL的二维表格形式存储)和Memcache类似,但很大程度补偿了Memcache的不足,Redis数据都是缓存在计算机内存中,不同的是,Memcache只能将数据缓存到内存中,无法自动定期写入硬盘,这就表示,一断电或重启,内存清空,数据丢失。原创 2022-09-14 10:42:01 · 1332 阅读 · 0 评论 -
TIDB简介及TIDB部署、原理和使用介绍
基于以上核心痛点,我们需要探索新的数据库技术方案来应对业务爆发式增长所带来的挑战,为业务提供更好的数据库服务支撑。调研市场上的各大数据库,我们可以考虑选用NewSQL技术来解决,因为NewSQL技术有如下显著特点:- 无限水平扩展能力- 分布式强一致性,确保数据 100% 安全- 完整的分布式事务处理能力与 ACID 特性 而TiDB数据库 GitHub的活跃度及社区贡献者方面都可以算得上是国际化的开源项目,是NewSQL技术中的代表性产品,所以我们可以选择使用TiDB数据库!原创 2022-08-22 16:38:29 · 12675 阅读 · 3 评论 -
HBase入门至进阶以及开发等知识梳理
Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统( Distributed File System),其中一个组件是HDFS(Hadoop Distributed File System)。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集原创 2022-08-18 13:55:50 · 2076 阅读 · 0 评论 -
redis各类部署以及使用介绍
redis各类部署以及使用介绍环境准备机器准备# 各机器配置了hosts[root@redis01 ~]# cat /etc/hosts127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4::1 localhost localhost.localdomain localhost6 localhost6.localdomain6# redis8.130.25.36 red原创 2022-03-01 17:59:30 · 925 阅读 · 0 评论 -
Clickhouse简介及Clickhouse部署、原理和使用介绍
Clickhouse简介及Clickhouse部署、原理和使用介绍第一章:Clickhouse简介第一节:clickhouse历史ClickHouse 是俄罗斯的第一大搜索引擎Yandex于2016年开源的列式存储数据库(DBMS [数据库管理系统Database Management System] ),使用C++语言编写,主要用于在线分析处理查询(OLAP),能够使用SQL查询实时生成分析数据报告, 与Hadoop, Spark相比,ClickHouse很轻量级。第二节:clickhouse相关原创 2021-08-24 12:05:38 · 4079 阅读 · 3 评论 -
Hbase简介及Hbase部署、原理和使用介绍,Phoenix使用
Hbase简介及Hbase部署、原理和使用介绍(+phoenix使用)HBase概述HBase定义HBase是一种分布式、可扩展、支持海量数据存储的NoSQL数据库。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式原创 2021-05-15 11:01:22 · 2356 阅读 · 6 评论 -
hadoop介绍部署文档
hadoop部署文档hadoop简介hadoop是什么1)Hadoop是一个由Apache基金会所开发的分布式系统基础架构。2)主要解决,海量数据的存储和海量数据的分析计算问题。3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。hadoop发展历史1)Lucene框架是Doug Cutting开创的开源软件,用Java书写代码,实现与Google类似的全文搜索功能,它提供了全文检索引擎的架构,包括完整的查询引擎和索引引擎。2)2001年年底Lucene成为Apach原创 2021-03-17 10:05:37 · 1578 阅读 · 0 评论 -
将elasticsearch(es)备份快照导入本地es并根据业务查询范例
1. 首选官方网站下载es以及kibana安装包https://www.elastic.co/cn/downloads/past-releases#elasticsearchhttps://www.elastic.co/cn/downloads/past-releases#kibana我这里下载了7.6.2版本,下载后解压[wasadm@ydt-dmcp-etl02 ~]$ ls -l *7.6.2*gz-rw-r--r-- 1 wasadm wasadm 2964775.原创 2021-01-28 11:34:16 · 1526 阅读 · 2 评论 -
Host‘x.x.x.x’ is not allowed to connect to this MySQL server(Navicat等报错提示)
在使用Navicat Premium等连接数据库时,有时会出现如下报错:Host‘0.0.0.0’ is not allowed to connect to this MySQL server的报错框大致表示在使用Navicat Premium的本地IP地址,不允许被连接到远程的MySQL数据库服务如果本地电脑IP地址可以正常连接其它数据库服务器操作。则解决办法如下:1、首先利...原创 2019-01-10 15:09:33 · 353 阅读 · 0 评论