![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 77
Hello.Reader
so far away
展开
-
显示IP归属地准确率高达99.9%的离线库
我们可以利用一些付费平台的API来实现这一功能,比如一些导航软件的开放平台API等。然而,这些服务通常是收费的,而且免费额度有限,适合测试使用,但如果要在生产环境中使用,很可能不够支撑需求。原创 2024-03-19 09:00:00 · 631 阅读 · 0 评论 -
Manticore Search号称Elasticsearch快15倍得全文检索引擎
Manticore Search 是一个使用 C++ 开发的高性能搜索引擎,创建于 2017 年,其前身是 Sphinx Search。Manticore Search 充分利用了 Sphinx,显着改进了它的功能,修复了数百个错误,几乎完全重写了代码并保持开源。这一切使 Manticore Search 成为一个现代,快速,轻量级和功能齐全的数据库,具有出色的全文搜索功能。Manticore Search目前在GitHub收获3.7k star,拥有大批忠实用户。原创 2024-03-08 10:26:38 · 1499 阅读 · 4 评论 -
java主副关键词组匹配升级高性能版
【代码】java主副关键词组匹配升级高性能版。原创 2024-01-23 17:48:47 · 434 阅读 · 0 评论 -
GraphBase基础原理
互联网时代,随着网络技术的发展,企业积累的数据越来越多。伴随着数据集的不断增加,传统的关系型数据库查询性能会随之变差,特别是针对一些特殊的业务场景,所以迫切的需要一种新的解决方案去应对这种危机。为了解决复杂的关系问题,图数据库应运而生。图数据库,是指以“图”这种数据结构存储和查询数据,图包含节点和关系,节点和关系可以存在标签和属性,且边可以有方向。原创 2023-09-15 09:35:00 · 7202 阅读 · 0 评论 -
Spark2x原理剖析(二)
基于社区已有的JDBCServer基础上,采用多主实例模式实现了其高可用性方案。集群中支持同时共存多个JDBCServer服务,通过客户端可以随机连接其中的任意一个服务进行业务操作。即使集群中一个或多个JDBCServer服务停止工作,也不影响用户通过同一个客户端接口连接其他正常的JDBCServer服务。多主实例模式相比主备模式的HA方案,优势主要体现在对以下两种场景的改进。主备模式下,当发生主备切换时,会存在一段时间内服务不可用,该时间JDBCServer无法控制,取决于Yarn服务的资源情况。原创 2023-09-05 09:58:18 · 11514 阅读 · 1 评论 -
DBService基础原理
DBService是一个高可用性的关系型数据库存储系统,适用于存储小量数据(10GB左右),比如:组件元数据。DBService仅提供给集群内部的组件使用,提供数据存储、查询、删除等功能。DBService是集群的基础组件,Hive、Hue、Oozie、Loader和Redis组件将元数据存储在DBService上,并由DBService提供这些元数据的备份与恢复功能。原创 2023-09-04 09:29:09 · 8766 阅读 · 0 评论 -
Flume原理剖析
Flume是一个高可用、高可靠,分布式的海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。原创 2023-08-09 09:24:12 · 11799 阅读 · 5 评论 -
apache doris数据库集群搭建(二)
该文档主要介绍了主要基于apache doris数据库搭建(一)的基础上进行集群搭建、升级、扩容操作讲解编写。原创 2023-07-12 14:54:56 · 11315 阅读 · 0 评论 -
flink高可用集群搭建(Standalone模式)
Apache Flink 是一个在有界数据流和无界数据流上进行有状态计算分布式处理引擎和框架。Flink 设计旨在所有常见的集群环境中运行,以任意规模和内存级速度执行计算。原创 2023-03-23 17:03:35 · 10668 阅读 · 1 评论 -
Hbase3.0.0及Hadoop3.3.1集群搭建(一)
1.概述HBase是Hadoop数据库,一种分布式、可扩展的大数据存储。当您需要对大数据进行随机、实时的读/写访问时,推荐使用HBase。该项目的目标是在商用硬件集群上托管非常大的表——数十亿行 X 数百万列。HBase 是一个开源、分布式、版本化、非关系型数据库,基于 Google 的Bigtable 等的结构化数据的分布式存储系统开发。正如 Bigtable 利用 Google 文件系统提供的分布式数据存储一样, HBase 在 Hadoop 和 HDFS 之上提供了类似 Bigtable 的功能。原创 2022-05-11 14:06:30 · 5303 阅读 · 1 评论