数据库
文章平均质量分 86
以数据库相关知识点为主
Hello.Reader
so far away
展开
-
Cassandra的核心优势与未来演进方向
这种架构使得Cassandra的扩展非常简单:当集群负载增加时,添加新的节点即可,而无需对已有的节点进行调整。机制,将数据暂时存储在其他节点上。当故障节点恢复时,这些节点会将暂存的数据发送回故障节点,确保最终的一致性。格式存储数据,当新的SSTable生成时,旧的数据不会被立即删除,而是通过压缩和合并(Compaction)机制来维护数据的高效存储和查询性能。通过合理调整一致性级别,并通过节点的无缝扩展,Cassandra能够在性能、可用性和一致性之间找到最佳平衡,满足不同应用场景下的需求。原创 2024-10-15 09:30:00 · 921 阅读 · 0 评论 -
Redisearch 入门指南构建高性能搜索应用
Redisearch 是一个强大的全文搜索引擎,基于流行的 Redis 数据库构建,专为高效的数据检索而设计。它结合了 Redis 的快速存储能力和搜索引擎的复杂查询功能,使得开发者能够在海量数据中实现实时搜索体验。Redisearch 支持丰富的特性,包括模糊匹配、布尔搜索、聚合、地理位置查询等,极大地增强了搜索的灵活性和准确性。这使其在电商、内容管理、社交平台等领域得到了广泛应用。原创 2024-09-25 13:25:22 · 1399 阅读 · 0 评论 -
Redis Pipeline 使用指南:从基础到进阶
Redis 是一个开源的内存数据结构存储系统,广泛用于缓存、消息代理和实时数据处理等场景。它以高性能和灵活性著称,支持字符串、哈希、列表、集合等多种数据结构,适合于多种应用。Redis Pipeline 是一种优化技术,允许客户端批量发送多个命令而无需等待每个命令的响应。这种方式显著减少了网络延迟,提高了处理速度,尤其在需要执行大量操作时,能有效提升性能。通过利用 Redis Pipeline,开发者可以更高效地进行数据存取操作,增强应用的响应能力。原创 2024-09-29 09:30:00 · 684 阅读 · 0 评论 -
Greenplum数据库全面解析
为了满足企业的大规模数据处理需求,项目团队决定使用Greenplum作为核心的数据仓库平台,主要因为其强大的并行处理能力和与大数据生态的集成能力。Greenplum作为数据仓库的核心:处理来自不同数据源的数据,进行批量数据导入、清洗和转换。Kafka用于实时数据流处理:收集来自线上商城和门店的实时交易数据,并通过外部表将数据实时加载到Greenplum中进行分析。Hadoop用于历史数据存储:使用HDFS作为冷数据的存储,Greenplum通过外部表对接HDFS中的历史数据,减少系统的存储压力。原创 2024-09-23 09:30:00 · 1246 阅读 · 0 评论 -
Neo4j技术指南
数据模型:使用表、行和列来表示数据,数据之间的关系通过外键和JOIN操作来实现。使用节点和关系直接表示实体和实体之间的关联,数据模型更贴近真实世界的关系网络。查询性能:在处理复杂的关联查询时,随着数据量和关系层级的增加,JOIN操作的性能会显著下降。由于关系被直接存储,查询复杂关系时性能表现稳定,高效地支持深度关系遍历。扩展性:垂直扩展为主,受限于单机性能,水平扩展复杂且成本高。更易于水平扩展,能够更好地适应大规模数据和高并发的应用场景。语法特点:声明式查询。原创 2024-09-21 10:00:00 · 1139 阅读 · 0 评论 -
深入解析 Apache Doris架构、应用场景与最佳实践
Apache Doris 是一款现代化的 MPP(Massively Parallel Processing)数据库,专注于解决大规模数据分析和实时查询的需求。它最初源自百度的 Palo 项目,随后贡献给了 Apache 基金会,并在开源社区的共同努力下不断演进。Doris 的设计目标是提供高效、简洁、易于使用的分析型数据库,能够在海量数据下进行快速响应的查询处理,尤其适用于数据仓库、BI 分析、以及实时数据处理场景。Doris 的核心优势之一在于其简化的架构和无缝的数据处理能力。原创 2024-09-19 09:00:00 · 981 阅读 · 0 评论 -
深入理解 ClickHouse 的性能调优与最佳实践
ClickHouse是一款由 Yandex 开发的开源列式数据库,专为在线分析处理(OLAP)场景设计。它以极高的查询性能著称,尤其适用于大规模数据的快速聚合和分析。自发布以来,ClickHouse 在多个行业中得到了广泛应用,例如日志分析、监控系统、用户行为分析、广告监控等。ClickHouse 的核心优势在于其列式存储架构高效的数据压缩、以及分布式处理能力。这些特性使得它能够在处理 TB 甚至 PB 级别的大数据时,依然保持快速的响应时间。原创 2024-09-17 09:15:00 · 1336 阅读 · 0 评论 -
MySQL NDB Cluste-分布式数据库集群搭建
###1 概述####1.1 分布式数据库集群Mysql cluster是适用于分布式计算环境的高可用、高冗余版本的mysql,其技术在分布式系统中为mysql数据提供了冗余特性,增强了安全性,使得单个mysql服务器故障不会对系统产生巨大的负面效应,系统的稳定性得到保障。Mysql cluster采用shared-nothing(无共享)架构,主要利用了NDB存储引擎来实现,NDB存储引擎是一个内存式存储引擎,要求数据必须全部加载到内存之中,具有自动分片(分区)功能。数据被自动分布在集群中的不同存储节原创 2021-07-13 15:22:27 · 6576 阅读 · 0 评论 -
Ubuntu数据库安装(mysql)
ubuntu安装mysql及修改数据目录原创 2023-03-11 04:45:32 · 3746 阅读 · 0 评论 -
Ubuntu安装mysql数据库(包括切换数据目录)
1.下载mysql-apt-config_0.8.22-1_all.deb并且安装wget https://dev.mysql.com/get/mysql-apt-config_0.8.22-1_all.debsudo dpkg -i mysql-apt-config_0.8.22-1_all.deb2.更新apt-updatasudo apt update3.如果出现如下图情况执行以下命令sudo apt --fix-broken install4.安装mysql-servers原创 2022-01-25 17:50:20 · 1743 阅读 · 0 评论 -
InfluxDB安装(各平台)
1. 准备安装InfluxDB包需要root或是有管理员权限才可以。2.网络InfluxDB默认使用下面的网络端口:TCP端口8086用作InfluxDB的客户端和服务端的http api通信TCP端口8088给备份和恢复数据的RPC服务使用另外,InfluxDB也提供了多个可能需要自定义端口的插件,所以的端口映射都可以通过配置文件修改,对于默认安装的InfluxDB,这个配置文件位于/etc/influxdb/influxdb.conf。3.NTPInfluxDB使用服务器本地时间给数据原创 2022-03-03 14:08:15 · 5132 阅读 · 1 评论 -
GraphBase基础原理
互联网时代,随着网络技术的发展,企业积累的数据越来越多。伴随着数据集的不断增加,传统的关系型数据库查询性能会随之变差,特别是针对一些特殊的业务场景,所以迫切的需要一种新的解决方案去应对这种危机。为了解决复杂的关系问题,图数据库应运而生。图数据库,是指以“图”这种数据结构存储和查询数据,图包含节点和关系,节点和关系可以存在标签和属性,且边可以有方向。原创 2023-09-15 09:35:00 · 7280 阅读 · 0 评论