自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(99)
  • 收藏
  • 关注

原创 HashData通过中国信通院可信数据库评测 入选中国数据库产业图谱

融合云计算技术,提供了自动化运维监控平台 CloudManager,通过对各类云平台资源的统一管理,整合数据库集群的监控、运维、管理等功能,建立统一的数字化管理运维平台,实现图形化、自动化操作,及时、高效应对数据库故障,大幅降低了数据仓库的运维管理成本。真正实现全部数据资产的统一数据平台纳管,建立企业级统一数据视图,融合各种数据平台、数据仓库与数据集市,大幅降低数据治理复杂度,缩短数据加工链路,避免数据冗余,避免数据孤岛,提升业务使用数据的敏捷性。在统一的元数据管理下,酷克数据旗下的企业版。

2024-07-17 14:29:27 400

原创 酷克数据亮相第13届PostgreSQL中国技术大会,获数据库杰出贡献奖

对于每个评估样本,分别执行 Ground-Truth SQL 和生成的 SQL,通过检验生成 SQL 的可执行度和比对查询结果的一致性,判断生成 SQL 的正确性,最终统计整个评估集的准确率。在《PostgreSQL 分布式数据库的开源新选择——CloudberryDB》的主题演讲中,酷克数据联合创始人马涛从技术发展与用户需求的角度,阐述了 CloudberryDB 作为 GP 的衍生版,在保持与 GP 原生兼容和无缝迁移的基础上,如何通过创新工程特性解决 GP 的痛点,并满足新型计算需求和架构下的挑战。

2024-07-13 23:01:17 459 2

原创 PostgreSQL 技术内幕(十七):FDW 实现原理与源码解析

首先,我们需要定义 FdwRoutine。前文提到了 FdwRoutine 主要负责定义外部数据扫描的接口,接口需要自定义实现外部扫描的方法。FdwRoutine 定义。

2024-07-05 09:48:57 889

原创 PostgreSQL 17 Beta1 发布,酷克数据再次贡献核心力量

在全球开源社区的共同努力下,PostgreSQL已经发展成为一款功能强大、稳定可靠的开源数据库,广泛应用于各行各业。随着本次beta版本的发布,我们看到了PostgreSQL 17在性能优化、功能增强和安全提升等方面的显著进步。酷克数据HashData研发团队饮水思源,通过代码贡献、PG技术讲解等方式,不断以开源精神和技术实力回馈社区。凭借团队对技术创新的不懈追求,酷克数据打造了一款面向分析和AI场景的下一代统一型开源数据库产品CloudberryDB,搭载了PostgreSQL 14.4 内核。

2024-06-05 16:05:22 933

原创 如何优雅实现存算分离:缓存及Tablespace讲解与演示

存算分离架构将存储与计算分离处理,解决了传统系统紧耦合带来的资源浪费问题,成为行业发展的新趋势。HashData云数仓通过引入缓存层和创新的Tablespace管理,不仅提高了数据访问速度,还实现了更灵活高效的数据存储与管理,为企业数据处理带来了革命性的提升。

2024-05-30 10:48:40 1251

原创 PostgreSQL技术内幕(十六)如何从0写一个执行器算子?

对于常规的查询语句,如简单的数据检索,执行器会生成匿名Portal来快速处理。更为重要的是,它与查询计划链表和查询完成结构紧密关联,这些结构进一步补充了查询执行的上下文,为用户和开发者提供了更为详尽的执行细节。执行器是数据库最重要的模块之一,作为连接查询计划和存储引擎的桥梁,负责从存储引擎读取数据,并基于查询计划树执行对应的算子,得到最终的查询结果。在SQL语句中,除了SELECT、FROM、WHERE、GROUP BY等关键字之外的部分,都可以被认为是某种表达式,例如:a列,a + 1,a * b等等。

2024-05-23 10:02:38 458

原创 携手鲲鹏昇腾 HashData展现云原生数仓创新力量

鲲鹏昇腾开发者大会2024在京举行,酷克数据受邀展示与鲲鹏联合开发的云数仓解决方案。HashData云数仓已完成信创适配,HashML提供一站式AI应用开发服务。酷克数据与国产生态共荣,将打造更智能的云数仓解决方案。

2024-05-10 15:52:54 224

原创 酷克数据启动鲲鹏原生应用开发合作

4月28日,酷克数据与华为签署鲲鹏原生开发合作协议。酷克数据将基于鲲鹏硬件底座开展原生应用开发,面向金融、政务、电信等行业打造云数仓产品解决方案,并发布性能更优的商用软件版本。酷克数据将利用鲲鹏高性能计算能力,提供个性化解决方案,满足各行业数据驱动发展需求。

2024-04-29 17:43:23 492

原创 数据统一高效管理 HashData支撑“数智石油”高质量发展

在2024中国石油石化企业信息技术交流大会上,酷克数据展示油气行业数据管理解决方案。基于HashData云端数据湖技术打造的“梦想云”数据湖,已经服务于中国石油60%以上的油田,为“数智中国石油”高质量发展提供了有力支撑。

2024-04-26 16:17:29 338

原创 HashData获得华为鲲鹏Validated认证 信创版图持续壮大

酷克数据自研企业级HashData云数仓通过华为鲲鹏高阶调优认证,获鲲鹏Validated技术认证书。该产品在TPC-DS测试中表现卓越,实现性能大幅提升。HashData云数仓已广泛应用于信创系统中,为信创场景提供可靠稳定的数据库支撑。

2024-04-23 10:24:03 612

原创 PostgreSQL技术内幕(十五):深度解析PG事务管理和分布式事务

因此,确保事务的原子性至关重要——若任何一个Segment上的数据写入操作失败,整个分布式事务中的其他Segment上的数据写入操作也必须回滚,以保持数据的一致性。然而,在其他尚未完成T1提交的Segment节点上,T2读取到的将是旧的数据值。但是,有一个特例:当前事务自己写入的数据对当前事务是可见的,而其他未完成的事务写入的数据是不可见的。如果事务日志持久化存储到了Wn记录,那么即便是数据库发生故障/断电,重启数据库后,都能从存储介质读取到事务日志,进行恢复记录的操作,确保数据的完整性和一致性。

2024-04-08 14:55:55 888

原创 HashData的湖仓一体思考:非结构化数据支持(Directory Table等)讲解

接下来,我们来给大家简单讲解下基于Directory Table特性的语料管理技术方案及demo演示。该技术方案旨在为客户提供一个高效、灵活的语料处理平台,核心在于利用Directory Table的特性,实现对各种格式的文档、图片等原始语料的统一存储、处理与管理。以上图为例,首先,原始语料数据(如文档、pdf/docx/html等文件,图片如jpeg/png等格式,以及视频和音频文件如rav4/mp4等)通过Copy工具或dataX工具,被导入到HashData数据库的Directory Table中。

2024-03-26 14:53:50 725

原创 PostgreSQL技术内幕(十四)探索PG的进程与内存管理

PostgreSQL因性能卓越、运行稳定受到欢迎,其多进程架构和内存管理机制为性能和稳定性提供支撑。多进程架构包括守护进程和服务进程,内存管理采用内存上下文机制,避免内存泄漏,提高内存分配效率。

2024-03-15 10:13:18 761

原创 15 年云数据库老兵DuckDB CEO:数据库圈应告别“唯性能论”

最成功的数据库公司,不是靠性能快过竞争对手而成功。

2024-03-13 15:46:15 870

原创 酷克数据荣获粤港澳大湾区金融创新成果“特优解决方案”奖

酷克数据的HashData云原生金融信创数据仓库入选“第二届金融创新优秀应用案例与解决方案技术成果评定”特优解决方案,成为数据治理与数据平台类目唯一厂商方案。该方案在信创环境下实现云原生部署,解决传统MPP数据库难题,为金融机构提供稳定大数据平台,释放数据价值。服务众多金融机构,并获得多项荣誉。此次获奖验证了HashData方案的技术创新和经济效益优势。

2024-03-08 12:12:22 225

原创 HashData的湖仓一体思考:Iceberg、Hudi特性讲解与支持方案

Hudi、Iceberg作为当前主流的数据湖方案,被众多企业所采用。HashData“湖仓一体”技术方案,打通了数据仓库和数据湖,底层支持多种数据类型并存,能够实现数据间的相互共享,为企业进行数据治理带来了更多的便利性。

2024-03-05 16:09:22 1132

原创 PostgreSQL技术内幕(十三)探究MPP数据库分布式查询分发Dispatcher

Dispatcher(分布式查询分发器)是MPP数据库的核心组件,所有的查询任务都要经过其进行分发,起着沟通用户到协调者和执行调度的关键作用。

2024-02-20 11:56:38 1010

原创 数据访问效率百倍提升 HashData助力中国石油乘“数”而行

中国石油天然气集团公司下属某大型油田向HashData工程服务团队发来感谢信,对其在数字化转型中的表现予以高度肯定。信中提及了HashData在“梦想云”数据湖建设中的核心作用,并表示HashData已服务于中国石油60%以上的油田。

2024-01-29 15:20:06 364

原创 点赞!HashData连续三年获评数据猿“最具投资价值企业奖”

近日,由数据猿和上海大数据联盟共同主办的“第六届“金猿奖”正式揭晓,HashData连续三年荣获“最具投资价值企业奖”,体现了业界对HashData投资价值及发展潜力的持续认可。

2024-01-25 19:27:28 350

原创 HashData湖仓一体方案:方案概览与Hive数据同步

HashData研发的HMS异构数据的一站式查询方案,通过轻量级、简单化的技术架构,降低企业湖仓建设过程中产品选型、数据管理的难度和成本,高效发挥湖仓一体低成本、高可用、易拓展等优势,帮助企业建立统一治理、湖仓一体的云原生数据分析平台。

2024-01-16 15:32:26 1289

原创 Postgres 中文周报:Postgres Weekly 537 期

本周报汇总了关于Postgres的最新动态,包括其荣获DB-Engines网站2023年度DBMS冠军、Postgres17的新增功能、备份工具和开发者工具的更新等。同时,还提到了多个即将举办的Postgres相关活动。

2024-01-12 14:06:16 852

原创 Postgres 中文周报:PostgreSQL 2023 热门回顾

本文在Postgres Weekly 2023 年度回顾文章的基础上,对PostgreSQL过去一年重要活动和技术更新进行了总结,方便读者更全面了解PostgreSQL发展趋势。

2024-01-08 15:50:36 1048

原创 BDTC2023:CloudberryDB开源创新与实践

CloudberryDB支持丰富的数据类型和数仓/AI混合负载,可开展SQL分析、机器学习、全文检索、HTAP等任务,通过数据存储加密、联合⾝份验证等技术手段,帮助企业更方便地自建高效稳定的数据底座。

2023-12-28 16:50:07 1343

原创 喜报!酷克数据携手中移在线入选2023大数据“星河”数据库优秀案例

https://mmbiz.qpic.cn/sz_mmbiz_png/Cr1iaZxXwaHUiaC7CPOfByMLeicqCx0eaA24V9nrpIP6Fib6gzicqWuo3UlWEAlYdnWhsT3z5Nyf8BUKpricUetNgc6Q/640?wx_fmt=png&from=appmsg&wxfrom=5&wx_lazy=1&wx_co=1

2023-12-25 17:18:54 904

原创 全面解读《State of PostgreSQL 2023》报告

一文了解PostgreSQL最新发展状况!

2023-12-22 14:13:56 1003

原创 创新铸就卓越 HashData再度荣获 IT168技术卓越奖

近日,由 IT168 主办的“2023 技术卓越奖”评选结果揭晓, 酷克数据基于云原生架构打造的HashData云数仓,凭借创新的技术架构、强大的性能表现、行业领先的落地规模,连年斩获数据库行业“技术卓越奖”。

2023-12-21 19:04:14 402

原创 打造绿色计算数智动力 HashData 入选“绿色计算最具价值解决方案”

随着“双碳”战略的不断推进,绿色低碳技术的深度应用将成为各行业可持续发展的核心竞争力。HashData通过自主可控技术创新,赋能数据基础设施构建新范式,加速数据基础设施绿色低碳升级改造。

2023-12-14 18:49:40 103

原创 HashData:大数据时代的“追光者”

酷克数据立足于行业客户的业务需求,完善产品和解决方案,探索新的行业领域,赋能千行百业转型升级,做大数据时代的“追光者”。

2023-12-11 10:41:18 105

原创 PostgreSQL 技术内幕(十二) CloudberryDB 并行化查询之路

CloudberryDB在Postgres的基础之上,对已有的并行执行计划进行了大量的调整和优化,实现了显著的性能提升。

2023-12-07 19:40:09 212

原创 数智融合 开启金融数据治理新时代

酷克数据始终秉持开放、合作、共赢的理念,与上下游厂商携手,共同建立长期稳定的生态联盟,打造融合、互惠、共赢的云数仓生态。

2023-11-28 10:07:34 74

原创 HashML——让更多企业读懂数据,用好AI

HashData推出的新一代高级分析和数据科学工具箱HashML,以简单易用、算法丰富、性能卓越的功能,帮助企业更高效地构建AI应用,更充分地释放数据价值,加速企业迈向AI时代。

2023-11-23 17:55:34 102

原创 PostgreSQL 技术内幕(十一)位图扫描

位图扫描原理是将索引扫描中的随机IO,尽量转换成顺序IO,降低执行计划的代价。它首先访问索引数据,过滤出符合提交的数据的索引信息(CTID),然后根据CTID来进行聚合和排序,将要访问数据页面有序化,同时数据访问的随机IO也转换成顺序IO。

2023-11-09 12:32:51 425

原创 HashData携手XSKY 助力企业构建数据智能底座

酷克数据联合XSKY星辰天合共同推出的云原生数据平台解决方案,采用湖仓一体、存算分离架构,融合数据仓库、数据湖、对象存储的优势,能够高效管理海量规模数据,满足企业多样化的大数据应用需求。

2023-11-06 10:31:50 86

原创 酷克数据出席永洪科技用户大会 携手驱动商业智能升级

近日,酷克数据与永洪科技双方产品完成兼容认证,共同携手为企业提供更加高效的全场景数据分析解决方案。 通过这次合作,双方将以更融合、更便捷的BI分析体验,帮助客户准确地洞察业务趋势,实现释放数据价值、深化科学决策。

2023-10-31 15:19:40 324

原创 性能卓越 全栈自主 HashData与华为金融数仓一体机联合方案全面解读

HashData联合华为存储共同推出了金融数仓一体机联合解决方案,为金融机构提供安全稳定、⾼效灵活、软硬结合的全栈国产化的云数仓服务,助⼒金融企业构建⼀体化、全视角数据分析平台,降低⼤数据分析⻔槛。

2023-10-26 17:14:14 91

原创 酷克数据发布HD-SQL-LLaMA模型,开启数据分析“人人可及”新时代

近日,酷克数据发布了专门用于从问题描述生成SQL的大语言模型HD-SQL-LLaMA,使复杂数据分析操作被极致简化,数据分析的门槛被进一步降低。

2023-10-20 18:00:26 380

原创 PostgreSQL 16正式发布 HashData贡献中国智慧

在最新发布PostgreSQL 16版本中,HashData技术专家团队参与了数十项代码贡献,为PostgreSQL 性能持续不断地改进和提升提供了核心技术支持。

2023-10-13 17:12:29 138

原创 同一份数据全域共享,HashData UnionStore实时性背后的故事

HashData UnionStore在保持顶层同一套引擎、底层同一套存储与数据的一致性设计的情况下,实现了近事务级的计算与查询实时性,为用户应用云数仓打开了新的思路和场景。

2023-09-22 15:57:11 261

原创 PostgreSQL 技术内幕(十)WAL log 模块基本原理

WAL log(Write Ahead Logging)也被称为xlog,是事务日志的一种,也是关系数据库系统中用于保证数据一致性和事务完整性的一系列技术,在数据库恢复、高可用、流复制、逻辑复制等模块中扮演着极其重要的角色。

2023-09-21 17:03:44 515

原创 开箱即⽤!HashData 云数仓上线华为蓝鲸应⽤商城

近⽇,经过华为对企业技术、产品和服务能⼒的综合评估,酷克数据企业级云原⽣数据仓库HashData通过与华为OceanStor Pacific 分布式存储的适配与优化,形成⼀体化解决⽅案,成功上线华为蓝鲸应⽤商城。

2023-09-14 15:57:02 359

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除