OpenMLDB + Jupyter Notebook:快速搭建机器学习应用 OpenMLDB 是一个开源机器学习数据库,提供线上线下一致的生产级特征平台。Jupyter Notebook 提供了基于浏览器网页的数据计算、代码开发、文档编辑、代码执行以及结果展示等功能,是目前最流行和最易用的开发环境之一。本篇文章介绍 OpenMLDB 与 Notebook 的深度整合,充分利用了 OpenMLDB 强大的功能特性和 Notebook 的便利性,从而打造一个快捷易用的机器学习开发环境。...
【Meetup预告】OpenMLDB+OneFlow:链接特征工程到模型训练,加速机器学习模型开发 OpenMLDBPMCcoremember卢冕,将从低成本、高性能的线上线下一致性特征平台开源解决方案切入,为大家介绍最新版本的OpenMLDB以及其性能改进、成本降低、灵活性增加的新特性。OneFlowPMCcoremember成诚,将以OneFlow——让大规模分布式深度学习变得更方便为议题,为听众介绍易用性和完备性进一步完善、模型迁移更方便快捷、大模型支持更高效的OneFlowv0.8.0以及其他高可用易扩展的方案和组件。...
数据生态第三弹 | RocketMQ OpenMLDB Connector,实时数据到特征工程的高速传输 导读:基于真实的企业业务场景,将线上实时数据更好更快地转化为 AI 可用特征是加速人工智能落地的有效路径之一。因此,OpenMLDB 积极打通数据生态上游,继面向实时消息队列 Pulsar、分布式流处理平台 Kafka 的两款 connector 发布后,OpenMLDB 和 RocketMQ 合作推出 RocketMQ OpenMLDB Connector,助力实时数据到特征工程的高速传输,加速人工智能工程化落地。未来 OpenMLDB 社区也将推出面向 Flink 的 connector……..
【Meetup 预告】RocketMQ OpenMLDB Connector,实时数据到特征工程的高速传输 2022年6月25日(周六)上午10:00-12:00,开源机器学习数据库 OpenMLDB 第四期 Meetup 将通过线上直播的形式展开。提供生产级实时数据及特征开发全栈解决方案的 OpenMLDB 和 RocketMQ 合作推出 RocketMQ OpenMLDB Connector,无缝链接线上数据生态,高效构建易用传输方案,创新加速 AI 工程化落地!开源机器学习数据库OpenMLDB Meetup 第四期将为大家介绍 RocketMQ OpenMLDB Connector ,并邀请……...
场景驱动的特征计算方式OpenMLDB,高效实现“现算先用” 导读:本文由Akulaku资深算法开发工程师黄泓4月23日在DataFunSummit上的演讲「Akulaku智能计算系统及应用」整理而成。在特征计算系统的实现上,Akulaku采用场景驱动方式,通过使用OpenMLDB,更加高效地实现特征“现用现算”。Akulaku是一家主打海外市场的互联网金融服务提供者,服务内容包括网上购物和分期付款,现金贷,保险等等。也就是Akulaku包含金融属性和电商属性,以金融属性为主。主要的应用场景包括金融风控,电商智能客服以及电商推荐等等。Akulaku的智能计算架构(如
实时特征计算平台架构方法论和基于 OpenMLDB 的实践 导读:在机器学习从开发到上线的闭环中,实时特征计算是其中的重要一环,用于完成数据的实时特征加工。由于其高时效性需求,数据科学家完成特征脚本离线开发以后,往往还需要工程化团队通过大量的优化才能完成上线。另一方面,由于存在离线开发和工程化上线两个流程,线上线下计算一致性验证成为一个必要步骤,并且会耗费大量的时间和人力。本文将从以上两个痛点出发,描述实时特征计算系统架构的优化目标 - 开发即上线,以及针对此优化目标的架构设计原则。最后,将会基于开源实时特征计算解决方案 OpenMLDB,具体描述其在实践中的架构…
[Meetup]OpenMLDBxDolphinScheduler 链接特征工程与调度环节,打造端到端MLOps工作流 2022年5月28日(周六)下午14:00-17:00,开源机器学习数据库 OpenMLDB 第三期 Meetup 将以线上直播的形式展开。活动背景OpenMLDB v0.5.0 在近期正式发布,性能、成本、灵活 再攀高峰!此次 Meetup 将为大家介绍 OpenMLDB v0.5.0版本的新功能,并邀请来自 DolphinScheduler 的技术大咖一起分享 DolphinScheduler 的技术实现及落地应用。本次活动,我们将发布与 DolphinScheduler 合作开发的 Dolphi
OpenMLDB v0.5.0 发布 | 性能、成本、灵活性再攀高峰 OpenMLDB v0.5.0 于近期正式发布,性能和功能实现重大优化更新和升级。三大核心升级带来性能、成本、灵活性的全面优化:- 在线性能数量级提升:引入预聚合技术,优化长窗口实时处理效率- 低成本落地选择:线上引擎引入基于外存的存储引擎- 使用场景灵活性扩展:支持用户自定义函数(UDF)开发
开源之夏 2022 火热来袭 | 欢迎报名 OpenMLDB 社区项目~ 活动介绍开源之夏是由“开源软件供应链点亮计划”发起并长期支持的一项暑期开源活动,由中国科学院软件研究所与 openEuler 社区共同举办,旨在鼓励在校学生积极参与开源软件的开发维护,促进优秀开源软件社区的蓬勃发展,培养和发掘更多优秀的开发者。学生可自主选择感兴趣的项目进行申请,并在中选后获得该软件资深维护者(社区导师)亲自指导的机会。根据项目的难易程度和完成情况,参与者还将获取开源之夏活动奖金和结项证书。OpenMLDB 社区的 5 个精选项目已经正式发布,任务包括数据导出工具开发、SDK开发&a.
构建面向特征工程的数据生态 ——拥抱开源生态,OpenMLDB全面打通MLOps生态工具链 OpenMLDB 提供FeatureOps 全栈解决方案,积极打通 MLOps工具链,建立起一个标准化的模型开发、部署与运维流程,降低开发者落地 AI 的门槛,使得企业组织能够更好地利用机器学习的能力来促进业务增长。
活动预告 | 4月23日,多场OpenMLDB精彩分享来袭,不负周末好时光 OpenMLDB · 周六(4.23)活动合集OpenMLDB 是一个开源机器学习数据库,致力于闭环解决 AI 工程化落地的数据治理难题。自 2021 年 6 月开源以来,OpenMLDB 优先开源了特征数据治理能力,依托 SQL 的开发能力,为企业提供全栈功能的、低门槛特征数据计算和管理平台。OpenMLDB 包含 Feature Store 的全部功能,并且提供更为完整的 FeatureOps 全栈方案。除了提供特征存储功能,还具有基于 SQL 的低门槛数据库开发体验、面向特征计算优化的 Open
精彩联动 | OpenMLDB Pulsar Connector原理和实操 人工智能工程化落地的关键点之一,在于解决真实业务场景的实时批量预估和实时模型更新问题。更好更快的将线上实时数据转化为AI可用的特征,将加速AI应用落地的效率及效果。为此,OpenMLDB 和 Apache Pulsar 合作推出OpenMLDB Pulsar Connector,实现稳定的流式集成,为高效打通实时数据到特征工程提供一条值得期待的清晰路径。关于OpenMLDBOpenMLDB 是一个开源机器学习数据库,致力于闭环解决 AI 工程化落地的数据治理难题。自 2021 年 6 月开源以来,Ope
OpenMLDB Pulsar Connector:高效打通实时数据到特征工程 **导读:**人工智能工程化落地的关键点之一,在于解决真实业务场景的实时批量预估和实时模型更新问题。更好更快地将线上实时数据转化为AI可用的特征,将加速AI应用落地的效率及效果。为此,OpenMLDB 和 Apache Pulsar 合作推出OpenMLDB Pulsar Connector,实现稳定的流式集成,为高效打通实时数据到特征工程提供一条值得期待的清晰路径。我是黄威,目前是第四范式研发架构师,也是OpenMLDB的核心研发。今天主要为大家介绍三个方面的内容:Pulsar Connector