自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 收藏
  • 关注

原创 论文图谱当如是:Awesome-Graphs用200篇图系统论文打个样

试想在你刚接触一个陌生的技术领域时,如果有办法以“上帝视角”看到该领域完整的历史发展轨迹,是否可以让自己的技术探索更有的放矢,胸有成竹呢?是的,你没猜错,这个玩意儿叫论文图谱。我通过“人肉扫描”了200多篇图计算系统的论文,整理了心中理想的“图系统论文图谱”原型,大家可以“类比想象”一下当下关注技术领域的论文图谱应当如何。

2024-07-24 11:23:16 1100

原创 Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读

引入知识图谱技术后,传统RAG链路到Graph RAG链路会有什么样的变化,如何兼容RAG中的向量数据库(Vector Database)和图数据库(Graph Database)基座,以及蚂蚁的Graph RAG开源技术方案和未来优化方向。

2024-06-17 20:14:44 2284

原创 妙用OSGraph:发掘GitHub知识图谱上的开源故事

OSGraph (Open Source Graph) 是一个开源图谱关系洞察工具,基于GitHub开源数据全域图谱,实现开发者行为、项目社区生态的分析洞察。可以为开发者、项目Owner、开源布道师、社区运营等提供简洁直观的开源数据视图,帮助你和你的项目制作专属的开源名片、寻求契合的开发伙伴、挖掘深度的社区价值。

2024-06-13 14:41:05 1486

原创 深入解读TuGraph计算引擎模型推理系统

TuGraph计算引擎模型推理系统将基于迭代计算的图计算框架与模型推理系统相结合,推理系统可自定义推理依赖环境,图迭代计算与推理链路实现隔离。基于共享内存的跨进程通信方式,提高了推理数据交换效率,满足流图近线推理的时效性。

2024-05-24 14:06:24 898

原创 ChatTuGraph:通过大模型“与图对话”

相比于SQL相对成熟的语法标准,图查询语言尚未形成成熟的统一标准,目前是多种查询语法并存的状态,上手门槛高,因此更需要借助大语言模型的自然语言理解能力,降低图数据库查询语言的使用门槛。

2024-03-27 11:55:55 626

原创 从API到Agent:万字长文洞悉LangChain工程化设计

给“AI外行人士”引入一下LangChain,试着从工程角度去理解LangChain的设计和使用。同时大家也可以将此文档作为LangChain的“10分钟快速上手”手册,本意是希望帮助需要的同学实现AI工程的Bootstrap。

2024-03-15 18:36:10 777

原创 TuGraph Analytics图数据集成:表到图的最后一公里

小伙伴们想玩一玩图计算,数据的导入工作总是绕不开的一个环节。为了降低大家数据导入操作的成本,提升图计算的整体使用体验,TuGraph Analytics推出了“图数据集成”能力,帮助大家通过简单配置完成数据导入工作。

2024-01-31 17:10:14 811

原创 TuGraph Analytics作业监控面板:运行时组件上的高效分析工具

我们在作业进程中内置了一个Dashboard(本地启动/容器启动时自动生效),包括前端页面和后端server,用户可以不需要感知到它们的存在。通过访问Dashboard,用户可以更方便地通过白屏化的方式查看作业的执行进度、组件列表和详情、任意组件内部的指标、日志等。还可以通过Profiler工具对进程状态进行分析,快速定位问题。

2024-01-05 18:46:03 481

原创 TuGraph Analytics交互式图查询:让图所见即所得

TuGraph Analytics提供了OLAP图分析能力,实现图上的交互式查询,用户在构图并导入数据之后,可以通过输入GQL语句对图查询分析,并以可视化的方式直观地展示点边结果。

2024-01-03 18:29:40 926

原创 重磅发布!!!蚂蚁图团队开源高性能原生图存储系统CStore

CStore是一款专门为图分析场景而设计的原生图存储引擎,它采用了Rust语言编写,使用基于图的存储结构,针对图分析场景进行特定优化。CStore可以存储包含千亿级点和万亿级边的图数据,在蚂蚁集团内部的多场景使用中,已经积累了多年的经验,存储容量达到了PB级别。

2023-12-13 20:19:40 1184

原创 世界第一!蚂蚁图计算TuGraph打破LDBC SNB-BI世界纪录

近日,国际关联数据基准委员会(Linked Data Benchmark Council,以下简称LDBC)发布了图数据基准测评“LDBC SNB-BI”最新结果。由蚂蚁集团自研的流式图计算引擎TuGraph Analytics在30TB规模的数据集上成功完成了基准测试,数据规模和性能打破了此前的公开纪录,关键指标中的并发吞吐量提升至2.84倍,查询能力提升至1.86倍。

2023-12-11 20:31:49 259

原创 TuGraph Analytics云原生部署:基于K8S Operator的轻量级作业启动方案

作者:丁一。

2023-11-29 17:16:13 135

原创 TuGraph Analytics动态插件:快速集成大数据生态系统

介绍 插件机制介绍 插件机制为GeaFlow任务提供了外部数据源的集成能力扩展,GeaFlow支持从各类Connector中读...

2023-11-15 17:36:00 157

原创 TuGraph Analytics图建模研发:为图计算业务提速增效

GeaFlow Console平台提供了图数据研发能力,包括了对点、边、图、表、函数、任务的管理功能, 为了让用户更好的管理元数据信息,同时也便于用户对图计算进一步地了解。通过对这些研发资源的管理,用户可以方便地、白屏化地创建、修改、删除这些元数据,也可以很方便地查看当前租户下所拥有的数据资产概览及详情,从而更多关注于业务逻辑的实现。

2023-10-25 14:59:34 233 1

原创 TuGraph Analytics图计算快速上手之弱联通分量算法

弱联通分量图算法(Weakly Connected Components Algorithm)是一种用于找到图中所有弱联通分量的算法。弱联通分量是指在有向图中,如果忽略所有边的方向,相互之间是连通的节点集合。算法的基本思想是通过深度优先搜索(DFS)或广度优先搜索(BFS)遍历图的所有节点,对于每个未访问过的节点,都会生成一个新的联通分量。在遍历过程中,如果当前节点的邻居节点已经被访问过,那么将其加入当前联通分量中,并继续遍历邻居节点。

2023-10-16 14:18:01 309 1

原创 Tugraph Analytics图计算快速上手之紧密中心度算法

*紧密中心度(Closeness Centrality)**计量了一个节点到其他所有节点的紧密性,即该节点到其他节点的距离的倒数;节点对应的值越高表示紧密性越好,能够在图中传播信息的能力越强,可用以衡量信息流入或流出该节点的能力,多用与社交网络中关键节点发掘等场景。对于图中一个给定节点,紧密性中心性是该节点到其他所有节点的最小距离和的倒数:其中,u表示待计算紧密中心度的节点,d(u, v)表示节点u到节点v的最短路径距离;

2023-09-19 11:22:34 284

原创 TuGraph Analytics 流图计算之行为路径归因

目前 TuGraph Analystics 已经在多类应用场景以及万亿级别的数据规模下提供了生产可用的计算服务,本文主要介绍在路径归因的场景下的实践。

2023-09-13 14:11:15 175 1

原创 TuGraph Analytics图计算快速上手之K-core算法

K-Core算法是一种用来在图中找出符合指定核心度的紧密关联的子图结构,在K-Core的结果子图中,每个顶点至少具有k的度数,且所有顶点都至少与该子图中的 k 个其他节点相连。K-Core通常用来对一个图进行子图划分,通过去除不重要的顶点,将符合逾期的子图暴露出来进行进一步分析。K-Core图算法常用来识别和提取图中的紧密连通群组,因具有较低的时间复杂度(线性)及较好的直观可解释性,广泛应用于金融风控、社交网络和生物学等研究领域。

2023-09-04 19:35:35 929 1

原创 一张图读懂TuGraph Analytics开源技术架构

GeaFlow(TuGraph-Analytics)是蚂蚁集团开源的分布式实时图计算引擎,即流式图计算。通过SQL+GQL融合分析语言对表模型和图模型进行统一处理,实现了流、批、图一体化计算,并支持了Exactly Once语义、高可用以及一站式图研发平台等生产化能力。

2023-08-22 15:09:45 334 1

原创 GeaFlow图计算快速上手之K-hop算法

K-hop算法是一种基于图论的算法,用于寻找一个起点通过K次以内跳跃能够到达的节点,也就是从起点出发,找出K层内与之关联的节点。K-hop算法广泛应用于好友推荐、影响力预测和关系发现等场景。K-hop算法本质上是一种广度优先搜索(BFS)算法,通过从起点开始不断向外扩散的方式来计算每一个节点到起点的跳跃数。

2023-08-15 11:45:57 632

原创 GeaFlow任务能力增强:通过API定制流图计算逻辑

GeaFlow API是对高阶用户提供的开发接口,用户可以直接通过编写java代码来编写计算作业,相比于DSL,API的方式开发更加灵活,也能实现更丰富的功能和更复杂的计算逻辑。

2023-08-14 20:19:30 188

原创 谁在以太坊区块链上循环交易?TuGraph + Kafka 的0元流图解决方案

实时交易数据我们采用了XBlock-ETH: Extracting and exploring blockchain data from Ethereum这篇论文整理的真实的以太坊区块数据,在这个Demo中把以太坊地址隐去,以一个数字替代,即每个数字代表以太坊的一个钱包地址,相同的数字表示相同的地址。各有各的长处,各有各的毛病。接下来,每当有新的交易到达的时刻,都将触发一次3跳循环交易模式的检查,把更新的结果存入位于Kafka的外部表tbl_circular_trade,可以很方便地分发给下游组件。

2023-07-11 11:53:24 256

原创 论文解读|EuroSys 2023《GPC: 基于编译器的面向图神经网络稀疏计算优化》

在这项工作中,我们提出了GPC (General sParse Compiler),一个新的编译器框架,它扩展了流行的Halide编译器,通过编译器驱动的优化和自动调整,使GNN的广义稀疏计算得到有效加速。针对高度优化的最先进的稀疏计算内核以及端到端GNN训练和推理效率的广泛评估表明,我们提出的GPC比最先进的稀疏计算内核实现了4.37倍的速度提升,比三个流行的GNN模型GCN、GraphSAGE和GAT的训练和推理速度提升了1.37~2.25倍。我们的成本模型是一个简单易训练的DNN,如图5所示。

2023-07-11 11:33:26 585

原创 从大数据到图计算-Graph On Big Data

这些大数据引擎主要处理的是表模型的数据,即将要处理的数据以表模型来建模,然后进行加工处理。表模型虽然相对简单,易于理解,然后也存在局限性,尤其是在处理复杂关系的运算和表达上存在着比较大的困难。表模型主要通过Join的方式来处理表之间的关联关系,Join的方式会带来大量的shuffle,增加运行资源。尤其是当关联度数比较高时,Join方式的弊端会更加明显。另外对于复杂关系的描述比如最短路径、k-hop等通过表模型语言SQL也很难表达。图模型作为一种以点和边作为基本单元定义的数据模型天然可以描述关联关系。在图模

2023-06-28 10:52:52 246 1

原创 论文解读|TuGraph Analytics 流式图计算论文入选国际顶会 SIGMOD

6月18日-23日,数据库国际顶会 2023 ACM SIGMOD 在美国西雅图举行,蚂蚁流式图计算团队一篇论文入选。

2023-06-28 10:28:12 533 1

原创 6月11日,2023开放原子全球开源峰会在北京开幕。本次峰会以“开源赋能,普惠未来”为主题。在高峰论坛上,蚂蚁技术研究院院长、图计算负责人陈文光宣布开源 TuGraph 图计算平台核心成员——工业级流

流式图计算是一种将流式计算和图计算结合的交叉创新,融合了流式计算的高度实效性和图计算的灵活性,攻坚难度极高。此次流式图计算引擎开源,是延续蚂蚁开源核心基础技术的实际动作,希望通过开放成熟的图计算技术,服务更广阔的数字化产业,向世界输出中国科技公司的前沿技术影响力。据了解,蚂蚁从2015年开始探索图计算,布局了图数据库、流式图计算引擎、图学习等相关技术,打造了世界规模领先的图计算集群,于业界首创了工业级流式图计算引擎,多次问鼎图数据库行业权威测试 LDBC 世界冠军并保持世界纪录。

2023-06-12 18:04:07 232

原创 芒种日,图新物,6月6日见

⚽️⚽️⚽️⚽️⚽️⚽️⚽️⚽️⚽️⚽️⚽️ ⛺️⛺️⛺️⛺️⛺️⛺️⛺️⛺️⛺️⛺️⛺️ 六月六日 14: 00 ...

2023-06-06 11:26:00 144

原创 恭喜!TuGraph 荣获 2022 中国开源创新大赛奖项

2022年中国开源创新大赛在中央网信办信息化发展局的指导下,由中国互联网发展基金会、中国网络空间研究院、中国互联网投资基金联合主办,以“开源创新,共建生态”为主题,围绕国家在开源人才培养和开源生态建设方面的重大战略需求,聚焦“卡脖子”相关技术领域以及前沿技术设置开源赛道,选拔优秀的开源项目,培养开源实践人才,助力开源生态建设。它提供了丰富的功能和灵活的查询接口,满足了用户对高效图数据管理和图分析的需求。作为开源项目,项目的发展离不开社区的支持和贡献,我们欢迎广大开发者和用户参与代码共建、交流问题和建议。

2023-06-05 11:45:11 152 1

原创 Antlr4 社区重大贡献:TuGraph 优化 C++ Target 并发性能提升10倍!

(预计阅读时间:6分钟) 最近,TuGraph团队开展了一项令人振奋的优化工作,成功将Antlr4 C++ target的并发性能提升超过10倍!这一优化方案已被Antlr4开源社区热情接纳,将给全球的Antlr C++生态开发...

2023-05-30 16:02:00 727

原创 互动福利|免费试用阿里云端TuGraph图数据库,还有GoPro、filco键盘、苹果HomePod mini等你拿!...

想要对数据关系进行 更好的数据可视化? ...

2023-03-23 11:01:00 251

原创 MeetUp预告|图技术应用场景实战

2023年03月26日14:00-16:30 ,TuGraph MeetUp 第二期-北京站,带来**「图技术应用场景实战」**,来自金融、电力科技领域的4位资深技术专家,将就图技术应用场景实战进行深度分享。大家也可就各自...

2023-03-20 16:55:00 205

原创 将博客搬至CSDN

博客内容会实时同步至CSDN平台????

2023-02-23 16:08:00 83

原创 管理数据资产,TuGraph打造数据血缘图谱

(预计阅读时间:8分钟) 数据血缘,数据旅行的地图 ...

2023-02-23 12:11:00 1921

原创 TuGraph开源JAVA客户端工具TuGraph-OGM,无缝对接JAVA开发生态

(预计阅读时间:7分钟) TuGraph 图数据库提供了 JAVA、C++、Python 等多种语言的 SDK 支持,方便客户在各种场景下使用。用户使用 SDK 向TuGraph服务器发送Cypher请求,服务器则以 JSON形...

2023-02-23 12:02:00 1272

原创 图计算领域报告最新发布

近日,全球信息技术研究机构Gartner®发布了《图数据库管理系统市场指南》报告,预测到2025年,包括图数据库管理系统在内的图技术市场将突破新关口,增长到32亿美元,复合年增长率为28.1%。 Gartner预测, "到202...

2023-02-23 11:49:00 216

原创 TuGraph在国产ARM平台上性能再次打破世界纪录

(预计阅读时间:4分钟) 太长不看版: ...

2023-02-23 11:31:00 865

原创 技术解读 I TuGraph查询引擎简析

(预计阅读时间:5分钟) 存储和计算是图数据库的两个重要组成部分。TuGraph的计算层包括图分析引擎、图查询引擎和图学习引擎。我们之前已经介绍了 图分析引...

2023-02-23 11:07:00 549

原创 蚂蚁高性能图数据库TuGraph-DB的技术思考与实践

在近日举行的 DTCC 2022 第十三届中国数据库技术大会-图数据技术与应用创新专场,蚂蚁集团图数据库负责人洪春涛博士分享了蚂蚁高性能图数据库TuGraph-DB的技术思考和实践,以下为演讲内容要点回顾。

2022-12-20 11:41:21 2691

原创 使用GraphInsight打造TuGraph可视化分析应用

图的可视化是分析和理解图数据的一种重要手段。TuGraph 内置了TuGraph Browser,为大多数用户提供了一个简单易用的图可视化界面。由于 TuGraph Browser 不支持自定义界面,因此一些有自定义界面需求的用户只能选择自行搭建新的前端界面。11月22日,蚂蚁集团将开源 GraphInsight(下文简称GI),该工具解决了快速搭建自定义图分析界面的问题。

2022-11-24 18:39:19 1874

原创 技术解读 | TuGraph图分析引擎技术剖析

借助TuGraph的 C++ 图分析引擎 API ,用户可以对不同数据来源的图数据快速导出一个待处理的复杂子图,然后在该子图上运行诸如BFS、PageRank、LPA、WCC等迭代式图算法,最后根据运行结果做出相应的对策。参数模块作用于分析引擎中的Standalone模式,用于对图的一般信息(如数据来源,算法名称,数据输入、输出路径,顶点个数等)以及根据不同数据来源、不同算法所配置的不同信息参数进行接受和整理,传输给图算法及各个模块,同时将最终结果模块化展示。一般分为预处理、算法过程、结果分析三个阶段。

2022-11-24 18:30:45 4138

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除