【开源数据平台dcluster】一个基于指标语义模型实现Chatbi的数据智能服务开源数据中台项目

dcluster是一款致力于开发从数据集成到数据开发治理再到数据智能分析的一站式服务平台。通过深入研究优秀的开源项目,集成到dcluster中。目前已经集成dolphinscheduler实现数据开发和数据同步集成,集成supersonic实现了基于指标管理的chatbi。当前正在集成dinky实现实时数据同步和开发。未来也会集成更多的优秀项目。

智能ChatBi&Copilot(集成supersonic)

多指标联合问答:基于指标模型支持单个指标问答以及多个指标多个维度联合问答

智能补全:支持输入搜索词后返回联想指标和维度,帮助快速补全

历史会话:对历史记录进行管理

 

指标管理

指标模型管理:快速灵活组合各个指标和维度,提供API和智能问答的指标语义模型

指标定义管理:支持原子指标和衍生指标的定义,统一指标口径指标

维度管理:对业务维度进行管理,标准规范化维度管理

 

数据质量管理(Datavines)

数据质量监控:定义和执行数据质量规则,如空值检测、重复值检测、范围检查等,确保数据的准确性和完整性。

告警和通知:当数据质量出现问题时,Datavines通过电子邮件、短信等方式发送告警通知,确保相关人员能够及时响应和处理问题。

数据治理:支持数据分类、标签和权限管理,确保数据的合规性和安全性。

数据质量报告:生成详细的数据质量报告,帮助用户了解和改进数据质量。

 

工作流调度(DolphinScheduler)

分布式架构:处理大规模的数据处理任务,确保系统的高可用性和扩展性。

任务依赖管理:定义复杂的任务依赖关系,确保任务按照预定的顺序执行。数据集成与开发:支持多种类型的任务,包括Shell、Python 脚本、SQL、MapReduce、Spark、Flink 等。

可视化工作流设计:提供直观的图形化用户界面,通过拖拽方式设计和配置工作流。

任务调度:支持灵活的调度策略,包括定时调度、依赖触发、手动触发等。任务监控与告警:实时监控任务的执行状态,并提供告警通知功能,确保问题及时处理。

资源管理:管理任务所需的资源,确保资源合理分配和使用。

 

实时数据处理(Dinky)

实时数据处理:Dinky 提供了强大的实时数据处理能力,支持Flink等流处理框架。

实时计算任务:用户可以定义和执行实时计算任务,处理实时数据流。数据集成:支持多种数据源和目标,能够将实时数据流集成到不同的数据系统中。可视化开发:提供直观的图形化界面,用户可以通过拖拽方式设计和配置实时计算任务。

监控与告警:实时监控数据流处理状态,并在出现异常时提供告警通知。高可用性:设计了高可用性和容错机制,确保实时数据处理的稳定性和可靠性。

 

数据集成

多数据源支持:支持多种数据源的集成,包括数据库、API、文件系统等,能够灵活应对不同的数据来源。

集成任务依赖支持:支持下游开发任务依赖集成同步任务,支持数据导出外部数据源任务依赖数据开发任务。

多执行引擎支持:支持多种执行引擎,包括DataX、seatunnal、flinkx等,满足不同场景的数据同步需求。

全库同步:支持整个数据库的同步,方便全面的数据迁移和复制。

.多表同步:支持多表同步,简化复杂的数据集成任务。全量和增量同步:提供全量和增量同步功能,实现数据的一体化同步。

断点续传:支持断点续传机制,确保数据集成过程的可靠性和稳定性。

 

数据查询

灵活高效的数据查询:支持多种数据源进行查询。多数据源支持:支持多种数据源的数据查询,适用于不同的数据存储系统。

高性能:优化的查询引擎,确保数据查询的高性能和低延迟。

 

数据分析

集成多种数据分析工具:集成多种数据分析和可视化工具,帮助用户快速获取洞见。可视化分析:提供丰富的可视化组件,用户可以通过图表、仪表板等方式展示分析结果。

高级分析功能:支持机器学习模型、统计分析等高级分析功能,满足复杂数据分析需求。

 

 

数据服务

数据服务接口:提供数据服务接口,支持RESTful API,方便数据的对外提供和集成。

灵活的数据访问:通过API提供灵活的数据访问方式,满足不同应用和系统的集成需求。

高可用性和安全性:设计了高可用性和安全性机制,确保数据服务的可靠性和数据的安全性。

 

github地址:https://gitee.com/zhenglv123456/dcluster

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值