大数据
文章平均质量分 65
LinkTime_Cloud
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
一键部署免费使用,Kubernetes上直接运行大数据平台
高度集成,单机即可体验大数据平台。开发者只要准备好命令行工具,一键部署Hadoop,Hive,Spark,Kafka, Flink, MinIO ...就可以创建大数据平台原创 2024-06-07 16:34:09 · 712 阅读 · 0 评论 -
Gartner:DataOps驱动数据工程最佳实践精华
作者 |Chris Bergh编译 |June2023年1月24日,Gartner发布了Robert Thanaraj、Ehtisham Zaidi和其他两位作者的文章《增强数据工程实践的5种方法》,DataKitchen给出了他的观点。Gartner在文章中指出,成功的数据工程团队面临两个关键挑战。1、如何优化数据团队生产力——本质上,团队应该避免在有更多工作需要完成时添加更多机构。在不雇佣...翻译 2023-03-03 11:36:59 · 687 阅读 · 0 评论 -
女神节 | PHP和Java算什么,女工程师才是最美最好的语言!
TA说:世界上第一个程序员是女性第一个发现Bug的也是女性在智领云有一群追求快乐和独立的女性工程师她们多有魅力?工位上她们专注于数据与代码平日里郊游、瑜伽、插花、科学养娃一件不落不仅用0和1编织数字世界也在用心装点自己的生活今天是国际劳动妇女节撑起了智领云半边天的女工程师们我们来听听她们的声音1在智领云做女工程师的感受?她们,能文能武 可盐可甜穿着优雅长裙的是她们紧急任务中担当重任的也是她们职场不...原创 2023-03-08 10:30:18 · 153 阅读 · 0 评论 -
女神节 | PHP和Java算什么,女工程师才是最美最好的语言!
走近智领云又美又飒女工程师原创 2023-03-09 09:28:43 · 382 阅读 · 0 评论 -
Hadoop势微,云原生上位——传统大数据平台的云原生化改造
以Hadoop为中心的大数据生态系统从2006年开源以来,一直是大部分公司构建大数据平台的选择,但这种传统选择随着人们深入地使用,出现越来越多的问题,。这些问题已经成为了困扰企业数字化转型加速迭代和升级的主要障碍。另一方面,从2014年开始,以Docker和Kubernetes(K8s)为代表的云原生技术蓬勃发展,云原生的社区和机构迅速壮大,到现在,Kubernetes已经成为企业搭建容器云平台的标配。那么,业界都在思考一个问题,高速发展的云原生技术能不能解决传统大数据平台的那些问题。答案是肯定的。原创 2022-09-27 17:54:48 · 865 阅读 · 0 评论 -
智领云独家技术支持,第十届全国高校新一代信息技术暑假师资研修班隆重开营
由智领云科技独家提供技术支持的“2022年第十届全国高校新一代信息技术暑假师资研修班”在海南三亚隆重开营。原创 2022-08-05 09:56:41 · 397 阅读 · 0 评论 -
硅谷速递 | DataOps常见问题、错误与相关概念
原文作者:DataKitchen、ODSC - Open Data Science、Sanna Diana Tomren嗨,大家好,智领云科技全新栏目【硅谷速递】重磅来袭,每周一为大家速...转载 2020-08-10 10:00:00 · 317 阅读 · 0 评论 -
硅谷速递 | DataOps常见问题、错误与相关概念
嗨,大家好,智领云科技全新栏目【硅谷速递】重磅来袭,每周一为大家速递美国硅谷最精彩的科技文章和学习资料,简约不简单是本栏目的最大特点,3篇短小精悍的文章,助你每周快速精准Get一项最新技术点!把握技术风向标,了解行业应用与实践,就交给“硅谷速递”吧~速递先知本期我们特别为大家带来三篇有关「DataOps」的硅谷前沿技术文章: 关于DataOps的十个常见问题 DataOps的5个常见错误 关于2020年的“Ops”- DevOps、DevSecOps、DataOps .原创 2020-08-14 01:34:14 · 406 阅读 · 0 评论 -
杠上Spark、Flink?Kafka为何转型流数据平台?
消息中间件系统(比如 RabbitMQ、Kafka、Pulsar 等)是现代实时数据或者流数据基础架构的关键环节。它通常作为一个数据管道,链接了各种业务前台和数据后台(比如数仓等)。但是随着越来越多的企业应用开始采纳流计算作为数据的计算引擎,以及基础架构的容器化、云化和无服务器化,这些消息系统也随之发生变化,逐步向流数据平台演进。在这篇文章中,笔者根据自己在这个领域从业多年的经验,详细解读消息系统的演化历史,不同消息系统在基础设施变革的浪潮中面临的挑战,以及他们相应的优势和劣势,并对消息系统怎么跟已有的计算转载 2020-08-06 17:12:02 · 385 阅读 · 0 评论 -
游戏行业应该如何建设数据中台?
随着网络世界的迅猛发展,“游戏”进入了前所未有的蓬勃发展期。根据Newzoo数据显示,2019年全球游戏市场规模约为1521亿美元,2015-2019年复合增长率达到13.4%,预计2020年全球游戏市场规模将进一步增加到1960亿美元。与此同时,游戏行业竞争日益激烈,游戏的种类与内容也越来越丰富多样化,要想在激烈的竞争中持续扩容并非易事。仅仅在“数据”层面上就面临着不少难题,例如,重复性工作与资源的浪费,不同游戏开发团队对数据与系统的重复开发,使得开发出一款新游戏时间周期过长;数据孤岛造成业务沟通壁.转载 2020-08-03 15:10:42 · 867 阅读 · 0 评论 -
打开通往新零售时代的大门,数据中台这把钥匙可行吗?
2016年“新零售”概念提出即被引爆,如今看来依然让人热血沸腾,因为这三个字,极有可能影响未来十年、二十年的商业格局。在新零售概念下,大数据技术可以在任何时间和地点无形地收集和沉淀客户的主要行为数据,直接掌握客户需求并直观地显示给商家。新零售,归根结底是对传统零售的重塑变革,“新”表现在从信息化到数字化的转变。具体而言,“信息化”是我们将结果记录在数据上,以便更好的存储和调用;“数字化”则是记录交易流程中每个动作,并将所有重要动作放在系统中,也就是说每个动作都是由数字来记录的。但是,企业由“信息化”走向原创 2020-07-21 21:05:24 · 393 阅读 · 0 评论 -
Uber基于Apache Hudi构建PB级数据湖实践
点击“蓝字”关注我们 文 | hudi来源|ApacheHudi1. 引言从确保准确预计到达时间到预测最佳交通路线,在Uber平台上提供安全、无缝的运输和交付体验需要可靠、高性能...转载 2020-07-14 22:46:27 · 1448 阅读 · 0 评论 -
建数据中台,治理烟囱式应用
本文来源| 至顶网文|邹大斌在一个有一定规模的企业中,通常都会存在各种各样的应用系统,它们分别由企业的各个不同部门、在各种不同历史时期、为满足各种不同业务目的而开发。由于数据格式没有统一规范,相互之间没有联通、数据更没有整合,像一个个烟囱,因此称其为“烟囱式应用”。在大数据应用兴起的今天,随着企业对数据价值的高度重视,烟囱式应用带来了数据整合难题,给数据的分析和挖掘带来了不小的困难,已经成为当代不少企业在大数据应用乃至智能化升级路上的一个拦路虎。有问题总要找到解决办法,诞生于互联网公司...原创 2020-07-06 19:00:13 · 1283 阅读 · 0 评论 -
云原生与数据中台 企业数字化转型的“正确打开方式”
本文来源| CSDN文| 刘丹以大数据、云计算、人工智能等新技术所推动的数字化转型正迅速的改变着我们所处的时代,其巨大的影响力已经从量变到质变。数字化运营已经成为企业发展的必然选择,而云原生技术与数据中台正是实现数字化运营所必须的创新技术与方法论。大部分企业在数字化转型的过程中,付出了不少的努力与时间,但因为对云原生与数据中台技术方法论了解匮乏,加之没有好的平台与体系来深入了解而走不少弯路。选择正确的方向,助力开发者与企业少走弯路,解决其在发展过程中面临的种种难题与挑战,10月26日举办的“...原创 2020-07-06 18:59:27 · 729 阅读 · 0 评论 -
数据中台送到家 企业数字化转型“输血”变“造血”
本文来源| CSDN文| 刘丹如果有人要问2019年技术圈什么最热,“中台”绝对当仁不让,从观望到试水,很多公司做出了从0到 1 的探索。众所周知,“中台”一词在国内最早是由阿里提出来的,2015 年,马云参观芬兰游戏公司Supercell,观察其每个游戏开发的小团队只有六七个人,但开发与停止的速度之快,让马云即惊讶又好奇。得知如此快的原因是开发者将游戏开发过程中用到的一些通用的游戏素材和算法整理出来,作为工具提供给小团队使用,使得同一套工具可以支持多个游戏研发团队。这样的架构模式给了马...原创 2020-07-06 18:58:48 · 363 阅读 · 0 评论 -
大浪淘沙后 DataOps依旧
DataOps的定义数据资产和数据产品的访问需求在与日俱增,想在市场中获得竞争力,DataOps是一门必不可少的学科。数据(和管理)团队和他们的平台无法跟上装备了DevOps的团队对他们提需求的节奏,这种状态推动了(数据团队的)DataOps发展。简而言之,DataOps将数据科学家、分析师、开发人员和运营人员凝聚在一起,共同致力于从设计阶段到生产支持的整个产品/服务生命周期。DataOps VS DevOpsDataOps并不仅仅是遵循DevOps原理并将其应用于数...原创 2020-07-06 18:58:21 · 447 阅读 · 0 评论 -
企业打造自己的数据中台,需要的是一套硅谷方法论
2015年12月,阿里宣布启动中台战略,打造“大中台、小前台”的组织机制和业务机制。从烟囱式架构到分布式架构,再到共享式架构,阿里取得了巨大成功,也带动了「中台」建设的热潮。如今,企业数字化转型已经成为一种趋势,特别是产业互联网时代的到来,越来越多的企业将「数字」视为核心资产,并开始探索「数据中台」的建设。然而,「数据中台」不同于一般的「大数据平台」,想要真正建设好「数据中台」,并发挥出数据的真正价值,是一项持久的工程,需要合适的方法论指导。如何理解「数据中台」的核心价值,并让...原创 2020-07-06 18:57:20 · 373 阅读 · 0 评论 -
Uber是如何管理大规模数据工作流的?
让这些数据可操作,需要进行数据提取、转换、解析和编排,从而在传统商业智能、机器学习、模型训练、可视化和报表等场景中广泛应用。尽管在Uber迅速发展的初期,上线了广覆盖面的数据工作流系统,用户须针对每种用例选择几种工具叠加使用。尽管此大型工具箱可实现敏捷且响应迅速的增长,但事实证明,它难以管理和维护,需要工程师在应对不同项目时,学习重复数据工作流系统。因此,Uber需要一个可以创建、管理、调度和部署数据工作流的中央工具。利用Uber之前部署的各种工具,包括基于Airflow的平台,Uber的技术开始开发与原创 2020-07-06 18:56:42 · 612 阅读 · 0 评论 -
Marquez,开源的元数据管理工具
Marquez是一款开源的元数据服务,用于数据生态系统元数据的收集、汇总及可视化。它维护着数据集的消费和生产,为作业运行时和数据集访问频率提供全局可见性,提供集中的数据集生命周期管理等。WeWork发布并开源了Marquez。Marquez的特征: 集中式元数据管理支持: 数据血缘(Data Lineage) 数据治理(Data governance) 数据健康检查(Data health)数据发现+探索(Data...原创 2020-07-06 18:56:03 · 10009 阅读 · 0 评论 -
智领数据 云享未来——线性资本「Demo Day 」,智领云闪耀全场
2019年9月3日 ,线性资本在上海举办了线性资本公开日第三期沙龙活动,线性资本LinearVenture成立于2014年,是一家国内风险投资基金,由京东天猫原高管张川Michael和Facebook早期员工王淮Harry创立。目前共管理着三支美元基金和两支人民币基金,管理的资产总规模超过15亿元人民币,已投项目公司估值总规模达到约110亿美元。为了更好的帮助所投企业取得进一步发展,线性资...原创 2019-09-08 21:10:05 · 461 阅读 · 1 评论
分享