【金猿人物展】天云数据雷涛:从数据湖到湖仓一体再到数据编织,完成的是燃油车到油电混再到纯电技术的改造...

本文讲述了数据技术的发展趋势,从数据湖到湖仓一体,再到数据编织,强调了数据新鲜度、面向服务的对象及存算分离的重要性。作者指出,HTAP系统和数据编织技术在支持实时分析、高并发服务和AI智能应用方面发挥关键作用,同时预测了信创战略和AI-Native数据库在未来的产业发展中将扮演重要角色。
摘要由CSDN通过智能技术生成


4a09a37b327a036e6b1161176b592a97.png

5b5b1d5cbf245e415e77edf3990cd254.png

雷涛

本文由天云数据CEO雷涛撰写并投递参与“数据猿年度金猿策划活动——2022大数据产业趋势人物榜单及奖项”评选。

1ae891ea10510966bed9ef5a65a358ec.png




‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业


17c09c2c06de19ef5d117850f9c3116f.png

这一两年,北美以Facebook、谷歌为驱动的存算分离的虚拟数仓架构,正在非常快速的洗牌现代的数据融合市场。其大的背景驱动是市场正在经历从数字化转向信息互联网和产业互联网阶次性的台阶变化。在这种变化之下,其实背后的技术驱动还是非常清晰很明显的,就是以Java、SQL为核心的流程驱动业务转向了AI和分布式这些技术框架的数字驱动业务。产业互联网带来了数据使用方式上的一次革命性升级。

1、第一个变化,就是数据新鲜度的变化。我们在使用什么时间的数据,是在消费以天、小时级、分钟级、秒级还是百毫秒级的数据?

20a10986121aeea27a638a8d37a3cbc2.png

俄乌战争,两个相同工业体系相同装备体系的国家,用不同的军事思想和技术手段打了一场令人瞠目结舌的仗。信息技术已经改变战争模式, 如果不能支撑实时性的战情数据流,不能确保数据的鲜活度,从本质上来讲双方打得就不是同一场战争了,因此市场需要高度重视HTAP系统提供新鲜分析的重要性。

今年一篇论文《我的HTAP系统有多好?》,谈到的第一个技术指标就是Freshness(新鲜度)。就你在消费什么时间的数据?用什么样的一个方式?如果基于传统BI架构的话,我们需要从Oracle、MySQL这些交易型的生产系统里把数据同步出来,用ETL的方式或者是批处理的方式加工到数据仓库里头。所以在数据仓库里,待分析的原材料已经是以天为时间的信息了。

你是在消费以天、小时级、分钟级、秒级还是百毫秒级的数据?我们怎么去把一些从最早的Storm、Spark Streaming这些流计算的框架到现在比较成熟的像Kafka、Flink的框架来驱动一个流数据作业?比如量化交易里,我们怎么去对冲击成本?对实时的挂单数据去做一个预测?这个肯定要基于3秒之内的挂单数据来完成。

现在的一些开源框架,通过工程化的手段能够被市场接受了。把TP和AP做融合,成为湖仓一体的概念;然后把MPP

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值