
OpenMLDB
第四范式开发者社区
AI for every developer,AI for everyone
展开
-
【Meetup预告】OpenMLDB+37手游:一键查收实时特征计算场景案例及进阶使用攻略
提供生产级实时数据及特征开发全栈解决方案的开源学习数据库 OpenMLDB 邀请到了 37手游 合作带来第六期 Meetup 分享。欢迎大家进群了解更多细节~本期线上分享将带领大家走进 OpenMLDB 最新的实践案例,了解 OpenMLDB 在37手游实时特征计算场景中的使用效益,收获在业务场景中使用 OpenMLDB 的实战经验;同时也会引领各位掌握 OpenMLDB 的进阶使用攻略,共同围观使用攻略背后技术原理的深度拆解。原创 2022-09-17 22:39:11 · 728 阅读 · 0 评论 -
OpenMLDB + Jupyter Notebook:快速搭建机器学习应用
OpenMLDB 是一个开源机器学习数据库,提供线上线下一致的生产级特征平台。Jupyter Notebook 提供了基于浏览器网页的数据计算、代码开发、文档编辑、代码执行以及结果展示等功能,是目前最流行和最易用的开发环境之一。本篇文章介绍 OpenMLDB 与 Notebook 的深度整合,充分利用了 OpenMLDB 强大的功能特性和 Notebook 的便利性,从而打造一个快捷易用的机器学习开发环境。...原创 2022-08-09 01:33:28 · 538 阅读 · 0 评论 -
【Meetup预告】OpenMLDB+OneFlow:链接特征工程到模型训练,加速机器学习模型开发
OpenMLDBPMCcoremember卢冕,将从低成本、高性能的线上线下一致性特征平台开源解决方案切入,为大家介绍最新版本的OpenMLDB以及其性能改进、成本降低、灵活性增加的新特性。OneFlowPMCcoremember成诚,将以OneFlow——让大规模分布式深度学习变得更方便为议题,为听众介绍易用性和完备性进一步完善、模型迁移更方便快捷、大模型支持更高效的OneFlowv0.8.0以及其他高可用易扩展的方案和组件。...原创 2022-07-27 21:47:40 · 771 阅读 · 0 评论 -
数据生态第三弹 | RocketMQ OpenMLDB Connector,实时数据到特征工程的高速传输
导读:基于真实的企业业务场景,将线上实时数据更好更快地转化为 AI 可用特征是加速人工智能落地的有效路径之一。因此,OpenMLDB 积极打通数据生态上游,继面向实时消息队列 Pulsar、分布式流处理平台 Kafka 的两款 connector 发布后,OpenMLDB 和 RocketMQ 合作推出 RocketMQ OpenMLDB Connector,助力实时数据到特征工程的高速传输,加速人工智能工程化落地。未来 OpenMLDB 社区也将推出面向 Flink 的 connector……..原创 2022-06-28 23:28:56 · 149 阅读 · 0 评论 -
【Meetup 预告】RocketMQ OpenMLDB Connector,实时数据到特征工程的高速传输
2022年6月25日(周六)上午10:00-12:00,开源机器学习数据库 OpenMLDB 第四期 Meetup 将通过线上直播的形式展开。提供生产级实时数据及特征开发全栈解决方案的 OpenMLDB 和 RocketMQ 合作推出 RocketMQ OpenMLDB Connector,无缝链接线上数据生态,高效构建易用传输方案,创新加速 AI 工程化落地!开源机器学习数据库OpenMLDB Meetup 第四期将为大家介绍 RocketMQ OpenMLDB Connector ,并邀请……...原创 2022-06-22 11:07:11 · 53 阅读 · 0 评论 -
场景驱动的特征计算方式OpenMLDB,高效实现“现算先用”
导读:本文由Akulaku资深算法开发工程师黄泓4月23日在DataFunSummit上的演讲「Akulaku智能计算系统及应用」整理而成。在特征计算系统的实现上,Akulaku采用场景驱动方式,通过使用OpenMLDB,更加高效地实现特征“现用现算”。Akulaku是一家主打海外市场的互联网金融服务提供者,服务内容包括网上购物和分期付款,现金贷,保险等等。也就是Akulaku包含金融属性和电商属性,以金融属性为主。主要的应用场景包括金融风控,电商智能客服以及电商推荐等等。Akulaku的智能计算架构(如原创 2022-06-02 10:45:51 · 191 阅读 · 0 评论 -
实时特征计算平台架构方法论和基于 OpenMLDB 的实践
导读:在机器学习从开发到上线的闭环中,实时特征计算是其中的重要一环,用于完成数据的实时特征加工。由于其高时效性需求,数据科学家完成特征脚本离线开发以后,往往还需要工程化团队通过大量的优化才能完成上线。另一方面,由于存在离线开发和工程化上线两个流程,线上线下计算一致性验证成为一个必要步骤,并且会耗费大量的时间和人力。本文将从以上两个痛点出发,描述实时特征计算系统架构的优化目标 - 开发即上线,以及针对此优化目标的架构设计原则。最后,将会基于开源实时特征计算解决方案 OpenMLDB,具体描述其在实践中的架构…原创 2022-06-02 10:14:12 · 398 阅读 · 0 评论 -
[Meetup]OpenMLDBxDolphinScheduler 链接特征工程与调度环节,打造端到端MLOps工作流
2022年5月28日(周六)下午14:00-17:00,开源机器学习数据库 OpenMLDB 第三期 Meetup 将以线上直播的形式展开。活动背景OpenMLDB v0.5.0 在近期正式发布,性能、成本、灵活 再攀高峰!此次 Meetup 将为大家介绍 OpenMLDB v0.5.0版本的新功能,并邀请来自 DolphinScheduler 的技术大咖一起分享 DolphinScheduler 的技术实现及落地应用。本次活动,我们将发布与 DolphinScheduler 合作开发的 Dolphi原创 2022-05-28 10:21:23 · 75 阅读 · 0 评论 -
OpenMLDB v0.5.0 发布 | 性能、成本、灵活性再攀高峰
OpenMLDB v0.5.0 于近期正式发布,性能和功能实现重大优化更新和升级。三大核心升级带来性能、成本、灵活性的全面优化:- 在线性能数量级提升:引入预聚合技术,优化长窗口实时处理效率- 低成本落地选择:线上引擎引入基于外存的存储引擎- 使用场景灵活性扩展:支持用户自定义函数(UDF)开发原创 2022-05-17 00:05:54 · 119 阅读 · 0 评论 -
开源之夏 2022 火热来袭 | 欢迎报名 OpenMLDB 社区项目~
活动介绍开源之夏是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,由中国科学院软件研究所与 openEuler 社区共同举办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展,培养和发掘更多优秀的开发者。学生可自主选择感兴趣的项目进行申请,并在中选后获得该软件资深维护者(社区导师)亲自指导的机会。根据项目的难易程度和完成情况,参与者还将获取开源之夏活动奖金和结项证书。OpenMLDB 社区的 5 个精选项目已经正式发布,任务包括数据导出工具开发、SDK开发&a.原创 2022-05-10 22:20:48 · 257 阅读 · 0 评论 -
贡献者任务第三期精彩来袭
叮,你收到一封来自社区的新邮件:开源机器学习数据库OpenMLDB,邀请你参与第三期贡献者任务。原创 2022-05-10 11:26:02 · 94 阅读 · 0 评论 -
OpenMLDB官网升级,神秘贡献者地图带你快速进阶
本次官网的更新包括贡献者地图、活动日历上线,贡献者和合作者名单的展示,还有在移动端的改善。具体细节请看下文吧!原创 2022-05-09 13:16:20 · 100 阅读 · 0 评论 -
构建面向特征工程的数据生态 ——拥抱开源生态,OpenMLDB全面打通MLOps生态工具链
OpenMLDB 提供FeatureOps 全栈解决方案,积极打通 MLOps工具链,建立起一个标准化的模型开发、部署与运维流程,降低开发者落地 AI 的门槛,使得企业组织能够更好地利用机器学习的能力来促进业务增长。原创 2022-05-06 10:10:29 · 404 阅读 · 0 评论 -
OpenMLDB Meetup No.2 会议纪要
OpenMLDB 社区于 2022 年 4 月 16 日举行了第二期 meetup,会议相关视频及资料尽在本文中~原创 2022-04-29 17:09:03 · 147 阅读 · 0 评论 -
OpenMLDB:线上线下一致的生产级特征计算平台
希望这场分享能够帮助大家了解 OpenMLDB 是什么,能做什么,适用于哪些场景。同时本文也将首次介绍 OpenMLDB的使用场景和生态构建。原创 2022-04-28 10:13:15 · 1900 阅读 · 0 评论 -
活动预告 | 4月23日,多场OpenMLDB精彩分享来袭,不负周末好时光
OpenMLDB · 周六(4.23)活动合集OpenMLDB 是一个开源机器学习数据库,致力于闭环解决 AI 工程化落地的数据治理难题。自 2021 年 6 月开源以来,OpenMLDB 优先开源了特征数据治理能力,依托 SQL 的开发能力,为企业提供全栈功能的、低门槛特征数据计算和管理平台。OpenMLDB 包含 Feature Store 的全部功能,并且提供更为完整的 FeatureOps 全栈方案。除了提供特征存储功能,还具有基于 SQL 的低门槛数据库开发体验、面向特征计算优化的 Open原创 2022-04-22 00:02:00 · 3147 阅读 · 0 评论 -
精彩联动 | OpenMLDB Pulsar Connector原理和实操
人工智能工程化落地的关键点之一,在于解决真实业务场景的实时批量预估和实时模型更新问题。更好更快的将线上实时数据转化为AI可用的特征,将加速AI应用落地的效率及效果。为此,OpenMLDB 和 Apache Pulsar 合作推出OpenMLDB Pulsar Connector,实现稳定的流式集成,为高效打通实时数据到特征工程提供一条值得期待的清晰路径。关于OpenMLDBOpenMLDB 是一个开源机器学习数据库,致力于闭环解决 AI 工程化落地的数据治理难题。自 2021 年 6 月开源以来,Ope原创 2022-04-21 11:21:25 · 1776 阅读 · 0 评论 -
OpenMLDB Pulsar Connector:高效打通实时数据到特征工程
**导读:**人工智能工程化落地的关键点之一,在于解决真实业务场景的实时批量预估和实时模型更新问题。更好更快地将线上实时数据转化为AI可用的特征,将加速AI应用落地的效率及效果。为此,OpenMLDB 和 Apache Pulsar 合作推出OpenMLDB Pulsar Connector,实现稳定的流式集成,为高效打通实时数据到特征工程提供一条值得期待的清晰路径。我是黄威,目前是第四范式研发架构师,也是OpenMLDB的核心研发。今天主要为大家介绍三个方面的内容:Pulsar Connector原创 2022-04-20 23:38:55 · 2299 阅读 · 0 评论 -
贡献指南,带你启航:如何给OpenMLDB社区贡献代码
新手指南,带你启航:如何给OpenMLDB社区贡献代码欢迎来到OpenMLDB开源社区!自2021年开源以来,OpenMLDB一直受到了广大用户的关注和青睐,也有志同道合的小伙伴接连不断地加入到社区当中 ,共同推动了OpenMLDB的进步和成长。作为国内首个开源机器学习数据库,我们以提供企业级 FeatureOps 全栈解决方案为己任,并且始终保持对社区开发者的期待与欢迎。如需简单了解OpenMLDB,可以点击这里查看文档,或者点击这里查看视频。欣喜于和老朋友交流碰撞、砥砺前行的同时,我们也希望能认原创 2022-04-07 13:31:26 · 120 阅读 · 0 评论 -
OpenMLDB 获评 CSDN IT 技术影响力之星 “年度开源项目”奖项
3 月 30 日,CSDN 2021 年度 IT 技术影响力之星颁奖典礼成功举行,OpenMLDB作为国内首个开源机器学习数据库,凭借持续进步的技术创新、不断扩展的功能覆盖斩获“年度开源项目”奖项。原创 2022-04-06 23:28:59 · 147 阅读 · 0 评论 -
活动预告 | OpenMLDB Meetup No.2
OpenMLDB x Pulsar | OpenMLDB Pulsar Connector,数据到特征的高速传输2022年4月16日(周六)上午10:00-12:00,开源机器学习数据库OpenMLDB第二期Meetup将以线上直播的形式展开。StreamNative联合创始人翟佳,将面向OpenMLDB的上游数据生态,深度解析云原生消息流平台Apache Pulsar。OpenMLDB研发负责人卢冕,将针对实时特征计算场景,介绍基于OpenMLDB的特征开发流程,以及机器学习特征计算平台架构原创 2022-04-01 21:18:35 · 2751 阅读 · 0 评论 -
OpenMLDB 在线模块架构解析
OpenMLDB 的在线模块主要负责特征脚本上线以后的实时特征计算,因此对于低延迟、高并发、高可用等有较高的要求。在线架构的主要模块包括 Apache ZooKeeper, nameserver 以及 tablets(进一步包含了SQL engine 和 storage engine)。如下图显示了这些模块之间的相互关系。其中 tablets 是整个 OpenMLDB 存储和计算的核心模块,也是消耗资源做多的模块;ZooKeeper 和 nameserver 主要用于辅助功能,如元数据的管理和高可用等。本文原创 2022-03-23 17:53:05 · 3818 阅读 · 0 评论 -
玩转OpenMLDB社区,四张角色卡待解锁
玩转OpenMLDB社区,四张角色卡待解锁原创 2022-03-22 11:06:17 · 3688 阅读 · 0 评论 -
【OpenMLDB Monthly Meeting】2022.2 月会议纪要
OpenMLDB 社区于近期邀请开发者举办了 2022 年 2 月份的社区会议。本次会议主要讨论的内容为:v0.4.2 版本发布以及包含的主要更新v0.5.0 版本的开发计划后续 GA 版本计划社区动态总结与预告社区反馈长窗口支持是非常重要的 feature,但是需要支持带有过滤条件的子句,如 count_where,否则在实际场景这中的使用会比较受限制基于外存(如 SSD)的存储引擎对于降低 OpenMLDB 的落地成本非常重要,期望更多的细节分享社区月度.原创 2022-03-10 15:05:21 · 67 阅读 · 0 评论 -
OpenMLDB 贡献者计划第二期惊喜上线
OpenMLDB 贡献者计划第二期惊喜上线!原创 2022-03-05 10:42:17 · 71 阅读 · 0 评论 -
深入浅出特征工程 -- 基于 OpenMLDB 的实践指南(下)
1. 准备知识在上期系列文章中(深入浅出特征工程 – 基于 OpenMLDB 的实践指南(上)),我们介绍了特征工程的基础概念、实践工具,以及基本的基于单表的特征脚本开发。在本篇文章中,我们将基于主表和副表,去展开详细介绍更加复杂和强大的基于多表的特征脚本开发。同时,我们依然依托 OpenMLDB 所提供的 SQL 语法进行特征工程脚本示例,关于 OpenMLDB 的更多信息可以访问我们的 GitHub repo,以及文档网站。OpenMLDB GitHub repoOpenMLDB 文档 · 看云原创 2022-03-03 14:19:25 · 189 阅读 · 0 评论 -
活动预告 | DataOps + MLOps Meetup
2022年3月12日(周六)14:00-16:30,由第四范式举办的DataOps + MLOps Meetup将于线上、线下同步开展。本次Meetup,特别邀请著名开源项目Apache DolphinScheduler PMC-郭炜及OpenMLDB核心研发工程师-陈迪豪共同分享DataOps、MLOps领域各自的见解,同时还将介绍他们所负责的项目。详细议程见海报,线下名额先到先得!欢迎大家扫码报名~MLOps交流群:https://sourl.cn/ASdJgu...原创 2022-03-01 14:21:24 · 72 阅读 · 0 评论 -
深入浅出特征工程 – 基于 OpenMLDB 的实践指南(上)
1. 什么是机器学习的特征工程一个真实场景的机器学习应用一般会包含两个主体流程,即特征工程和机器学习模型(以下简称模型)。大家对模型一定很了解,平时也是接触的最多的,比如从经典的逻辑回归、决策树模型,到近几年大火的深度学习模型,都是聚焦于如何开发高质量的模型。对于特征工程,可能大家相对关注较少。但是大家一定听说过坊间传闻的一句”名言“:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,对于特征工程的重要性大家早有共识。一句话来定义特征工程:使用特定的领域知识,从原始数据中抽取有原创 2022-02-18 14:19:37 · 275 阅读 · 0 评论 -
OpenMLDB 官方网站正式上线
“爱”在身边,“AI”在眼前。2022年情人节,大家期待已久的 OpenMLDB 官方网站终于带着满满的“AI”与诚意,正式上线啦!欢迎大家前来体验~AI在界面清新色调,简洁设计。官网界面结合品牌的主色调和产品的目标理念设计而成,以清新的绿色基调和简约明晰的栏目图标,让开发者在浏览官网内容时,畅享审美上的舒适愉悦,坐拥视觉上的极致体验。清新界面AI在布局科学分区,精致布局。OpenMLDB 官方网站内含首页、介绍、场景、博客、文档、社区等六大板块,揽括现有教程资料,便利用户查找使用,帮助开发者原创 2022-02-16 19:57:23 · 1395 阅读 · 0 评论 -
基于OpenMLDB v0.4.0快速搭建全流程线上AI应用
本文根据陈迪豪在『OpenMLDB Meetup No.1』中的演讲整理而成。基于OpenMLDB v0.4.0快速搭建全流程线上AI应用OpenMLDB在立项开始就有很多性能的优化,包括基于LLVM的JIT优化,可以针对不同的CPU架构、Linux服务器或MAC服务器,通过LLVM做对应的代码生成优化,甚至是最新的基于M1的ARM架构苹果电脑,也是可以让OpenMLDB针对这种场景做优化的。前面提到了在部分场景OpenMLDB可以比Spark有10倍甚至10倍以上的性能提升,其实也得益.原创 2022-01-29 14:01:43 · 3503 阅读 · 0 评论 -
开源机器学习数据库OpenMLDB v0.4.0产品介绍
本文根据卢冕在『OpenMLDB Meetup No.1』中的演讲整理而成。开源机器学习数据库OpenMLDB:为企业提供全栈FeatureOps解决方案今天的演讲围绕OpenMLDB给企业提供全栈FeatureOps解决方案展开,同时对OpenMLDB的主要特性和新发布0.4.0版本的新功能进行介绍。首先介绍一下我自己,我叫卢冕,博士毕业于香港科技大学计算机系,目前在第四范式担任系统架构师,主要负责数据库团队和高性能计算团队,同时也是开源项目OpenMLDB的主要研发负责人,目前主要专注于数据库.原创 2022-01-29 11:59:38 · 2701 阅读 · 0 评论 -
OpenMLDB在AKULAKU实时特征计算场景的应用
本文根据 Akulaku 算法总监马宇翔在『OpenMLDB Meetup No.1』中的演讲整理而成。OpenMLDB在AKULAKU实时特征计算场景的应用 马宇翔 AKULAKU 算法总监本文主要围绕下面四点展开:AKULAKU介绍初识OpenMLDB业务场景应用演进建议【01 | AKULAKU介绍】关于AkulakuAkulaku公司成立于2016年,是一家专注于东南亚市场的金融科技公司。金融科技公司的显著特点,就是所有的业务都和钱直接相关。Akulaku的业务场景从.原创 2022-01-21 15:49:17 · 1836 阅读 · 0 评论 -
【OpenMLDB Meetup #1】会议纪要
1. 会议内容OpenMLDB 社区于 2022 年 1 月 15 日举行了第一次面向整个社区的 meetup,不仅由 OpenMLDB 的核心开发团队分享了整体架构以及 v0.4.0 的新特性演示,而且邀请到了 OpenMLDB 的企业客户 - Akulaku 来分享基于 OpenMLDB 的实时特征计算实战场景。会议主要日程及相关材料如下:Opening郑曌 | 第四范式研发副总裁、OpenMLDB项目发起人视频,PPT开源机器学习数据库 OpenMLDB:提供企业级 FeatureOps原创 2022-01-20 15:09:28 · 273 阅读 · 0 评论 -
活动预告 | OpenMLDB Meetup No.1
活动预告 | OpenMLDB Meetup No.12022年1月15日(本周六)10:00-12:00,开源机器学习数据库OpenMLDB首次Meetup将在线上展开。活动邀请到Akulaku算法总监-马宇翔,分享Akulaku智能风控系统基于OpenMLDB的应用实践。OpenMLDB项目发起人-郑曌,OpenMLDB研发负责人-卢冕,OpenMLDB核心研发工程师-陈迪豪,将共同分享企业级全栈FeatureOps解决方案OpenMLDB设计原理及0.4.0版本发布,以及快速搭建全流程线上AI应用原创 2022-01-10 16:53:43 · 245 阅读 · 0 评论 -
【OpenMLDB Monthly Meeting】OpenMLDB 12月会议纪要
OpenMLDB 社区于近期邀请了社区的贡献者和使用者举行了12月份的社区会议。本次会议主要讨论内容:0.4.0版本目前的开发进度介绍讨论若干 0.5.0 版本规划中的 features以及社区反馈搜集1月份社区活动预告社区反馈:Latency and QPS: 期望表, database级别 metrics 监控,拉上相关同学再详细对一遍预聚合可以支持的OP后续给一张列表(精确支持,模糊支持,不能支持),按照优先级去取舍;可以考虑同时提供非精确计算接口外存版本能原创 2021-12-31 14:44:15 · 297 阅读 · 0 评论 -
企业智能转型对AI技术的挑战及应对,答案是MLOps
笔者在参加12月20日举行的,由LF AI & Data基金会和OpenI启智社区联合举办的2021新一代人工智能院士高峰论坛上分享对于企业智能转型,以及AI技术面临的挑战和应对。原创 2021-12-24 00:06:08 · 1035 阅读 · 0 评论 -
国内首次Feature Store Meetup回顾
2021年12月11日,由第四范式开发者社区主办的国内首次“Feature Store Meetup”,邀请到了来自美团、小米、伴鱼、第四范式的国内机器学习工程领域前沿专家,共同带来关于MLOps、及Feature Store的相关分享。原创 2021-12-16 16:00:20 · 1144 阅读 · 0 评论 -
活动预告|Feature Store Meetup
活动预告|Feature Store Meetup2021年12月11日 14:00-18:00,第四范式开发者社区Feature Store Meetup将在第四范式北京Office召开。活动邀请到小米商业平台技术部负责人-黄飞、美团外卖广告预估方向工程负责人-邹亚劼、伴鱼AI平台负责人-陈易生,共同讨论Feature Store在各公司的实现与应用。第四范式系统架构师、数据库团队和高性能计算团队负责人、开源项目 OpenMLDB 负责人-卢冕还将带来“开源机器学习数据库 OpenMLDB:为企业提供原创 2021-12-10 10:36:09 · 881 阅读 · 0 评论 -
开源机器学习数据库OpenMLDB贡献者计划全面启动
随着OpenMLDB 0.3.0版本的发布,OpenMLDB社区发起「OpenMLDB贡献者计划」(OpenMLDB Contributor Program,简称OCP),希望更多开发者参与社区建设,一同构建包容、友好、完善的开源生态,加速AI工程化落地进程。原创 2021-12-06 11:32:27 · 1264 阅读 · 0 评论 -
第四范式x英特尔“AI应用与异构内存编程挑战赛”圆满收官
近日,由第四范式与英特尔联合主办,第四范式开发者社区、MemArk技术社区共同承办的“AI应用与异构内存编程挑战赛”圆满收官。本次大赛基于第四范式开放人工智能操作系统平台AIOS社区版(https://openaios.4paradigm.com),聚焦多级异构存储优化技术,围绕人工智能与工业级最先进硬件技术的深度融合与应用,面向不同编程水平的企业开发人员、高校学生及相关领域爱好者,设置“编程挑战赛”及“应用闯关赛”两大赛道,为开发者提供沉浸式比赛环境,体验人工智能与异构内存相结合的技术魅力。本次大赛共有原创 2021-11-22 14:17:55 · 5152 阅读 · 0 评论