自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据流动

公号 大数据流动 专注于大数据,实时计算,数据治理,数据可视化相关技术与应用。

  • 博客(302)
  • 资源 (56)
  • 收藏
  • 关注

原创 一小时搭建实时数据分析平台

实时数据分析门槛较高,我们如何用极少的开发工作就完成实时数据平台的搭建,做出炫酷的图表呢?如何快速的搭建实时数据分析平台,首先我们需要实时数据的接入端,我们选择高扩展性、容错性、速度极快的消息系统Kafka,而实时数据仓库,由于 Druid提供了非常方便快捷配置方式,如果不想编写负责的Flink和Spark代码,Druid绝对是一个不错的选择,有了数据仓库,我们必须需要一个可视化和交互式分析...

2020-04-28 15:39:13 1905

原创 一文看懂《数据安全治理实践指南(4.0)》(附思维导图,附下载)

大家好,我是独孤风,大数据流动的作者。资料获取方式在文末。在数字化浪潮汹涌澎湃的当下,数据已成为企业乃至国家发展的核心资产,其重要性不言而喻。然而,随着数据的广泛应用和快速流转,数据安全问题也日益凸显,如同悬在头顶的达摩克利斯之剑,时刻威胁着企业的稳定运营和用户的隐私安全。在此背景下,《数据安全治理实践指南(4.0)》的发布犹如一场及时雨,为我们在数据安全治理的复杂迷宫中指明了方向。本文将基于白皮...

2025-01-21 08:24:48 642

原创 大数据SQL优化系列——01 大数据为什么选择SQL?

由于公众号更新了规则,如果不星标,就看不到大数据流动的推送消息了。请把大数据流动星标吧,谢谢,感谢大家的支持~大家好,我是独孤风。近几年来,大数据技术蓬勃发展,新组件新技术层出不穷,但无论如何变化,SQL 在大数据中的地位从未改变。本文我们详细探讨下大数据为什么选择了SQL,并说明SQL对于大数据的重要意义。本文为《大数据SQL优化:原理与实践》一书读书笔记,部分观点参考自书中原文,如需更详细的了...

2025-01-17 08:24:35 532

原创 编程新宠来袭!豆包 MarsCode 开启智能开发新纪元

在当今数字化时代,软件开发行业蓬勃发展,编程工具的优劣直接影响着开发效率和质量。字节跳动推出的豆包 MarsCode,凭借其强大的功能和便捷的使用体验,成为众多开发者的得力助手。豆包 MarsCode 具备多种实用功能,为开发者提供了全方位的支持。它支持超过 100 种编程语言,涵盖主流的 Go、Python、C++ 等,无论开发者从事何种领域的编程工作,都能满足需求。同时,它拥有编程助手和云端集...

2025-01-16 08:24:50 286

原创 【好书推荐】重磅!“西瓜书”《机器学习》官方配套习题集正式出版

大家好呀,我是独孤风。欢迎再次来到好书推荐的时间。在当今科技飞速发展的时代,近年来,大模型的异军突起无疑成为了推动人工智能不断迈向新高度的强大引擎,为众多领域带来了更为强大的支持以及翻天覆地的变革。在各个行业中,人工智能的身影无处不在,它就像一把万能钥匙,开启了无数创新和发展的大门,让我们的生产效率大幅提升,生活也变得更加便捷和智能化。所以呀,学习人工智能对于我们来说至关重要,它不仅能够帮助我们深...

2025-01-15 08:24:59 241

原创 “AI 基石”之数据标注,一文看懂《关于促进数据标注产业高质量发展的实施意见》(附思维导图,附下载)...

大家好,我是独孤风,一位从港口煤炭工人转型而来的国企大数据负责人,同时也是公众号“大数据流动”的作者。2025年1月13日,国家发展改革委等四部门发布《关于促进数据标注产业高质量发展的实施意见》。四部门:培育一批数据标注龙头企业 鼓励通过资源整合、并购重组等方式做大做强。①到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%;②加强跨领域跨模态...

2025-01-14 08:25:00 454

原创 2025数据治理资料库开放加入!(畅享数据要素、数据资产、数据空间、数场等海量核心资料与社群)...

大家好,我是独孤风。有一些是新的朋友,做一下简单的自我介绍:我是一名程序员,一个数据人,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,非全日制硕士在读,公众号大数据流动的作者。我热爱学习,虽然年少时走了一些弯路,但在28岁的时候转行,从头开始踏上学习之路,也改变了自己的命运。在当今数字化时代,数据治理对企业和个人成长均具有深远且不可替代的重要意义。对于企业而言,它是决策的基石,准确、完整且一...

2025-01-09 08:25:09 296

原创 【好书推荐】《大数据SQL优化:原理与实践》:大数据从业者晋升之路

大家好,我是独孤风。又到了好书推荐的时间。近几年来,大数据技术蓬勃发展,新组件新技术层出不穷,但无论如何变化,SQL 在大数据中的地位从未改变。大数据 SQL 为何如此重要,在这方面市面上一直缺少一本全面讲解大数据 SQL 原理与优化的书籍,终于《大数据SQL优化:原理与实践》一书出版了。这本书站在一线开发人员的视角,从 SQL 的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需...

2025-01-08 08:24:54 270

原创 2025年CDMP认证考试时间表已公布!训练营开放报名!在企业数字化转型浪潮中领先一步!...

大家好,我是独孤风,一位曾经的港口煤炭工人,如今在某国企担任大数据负责人,同时也是大数据流动的作者。在我的职业生涯中,我深刻感受到数字化转型对企业未来发展的重要性,而数据治理能力是其中的核心。这几年,数字化浪潮席卷全球,企业对数据治理和管理人才的需求愈发迫切。作为数据治理领域的权威认证,CDMP被视为数字化转型中的必备利器。近期,2025年CDMP认证考试的时间表已经正式对外公布,这无疑是所有关注...

2025-01-07 08:24:31 584

原创 2025数据治理资料库开放加入!(畅享数据空间、数场、数据要素、数据资产、元数据管理、数据质量等海量核心资料)...

大家好,我是独孤风。有一些是新的朋友,做一下简单的自我介绍:我是一名程序员,一个数据人,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,非全日制硕士在读,公众号大数据流动的作者。我热爱学习,虽然年少时走了一些弯路,但在28岁的时候转行,从头开始踏上学习之路,也改变了自己的命运。在当今数字化时代,数据治理对企业和个人成长均具有深远且不可替代的重要意义。对于企业而言,它是决策的基石,准确、完整且一...

2025-01-07 08:24:31 274

原创 2025年第一份重磅数据政策文件!一文看懂《国家数据基础设施建设指引》(附思维导图,附下载)...

大家好,我是独孤风,一位从港口煤炭工人转型而来的国企大数据负责人,同时也是公众号“大数据流动”的作者。2025 年 1 月 6 日,国家发展改革委、国家数据局、工业和信息化部组织制定了《国家数据基础设施建设指引》:①到2029年,初步形成横向联通、纵向贯通、协调有力的国家数据基础设施基本格局;②建设全国一体化算力网监测调度平台;③构建标准化、规范化的交互接口 实现数据基础设施的互联互通;④推进算力...

2025-01-07 08:24:31 577

原创 2024年数据治理大事件回顾:政策风向、行业趋势与必读书单

2024年12月30日,国家发改委、国家数据局、教育部、财政部、金融监管总局、中国证监会六部门发文!《关于促进数据产业高质量发展的指导意见》。这一重磅政策标志着国家对数据产业的高度重视,也为数据治理及产业发展指明了新的方向,为2024年的数据领域画上了一个完美的句号。大家好,我是独孤风,一位曾经的港口煤炭工人,现在在某国企担任大数据负责人,同时也是大数据流动的作者。2024年,数据治理领域迎来了重...

2024-12-31 08:24:24 595

原创 一文看懂《可信数据空间发展行动计划(2024—2028 年)》(附思维导图,附下载)...

大家好,我是独孤风,一位曾经的港口煤炭工人,如今在某国企担任大数据负责人,同时也是大数据流动的作者。多年深耕于数据领域,让我对数据要素的价值和数据流通的潜力有了深刻的认识。近日,国家数据局发布了《可信数据空间发展行动计划(2024—2028年)》,这是一份全面阐述如何构建可信数据空间、推进数据要素市场化配置、实现数据高效流通的重要战略文件。可信数据空间被定义为基于共识规则,联接多方主体,实现数据共...

2024-12-27 08:53:29 657

原创 在企业数字化转型浪潮中领先一步,2025年CDMP认证考试时间表已公布!

大家好,我是独孤风,一位曾经的港口煤炭工人,如今在某国企担任大数据负责人,同时也是大数据流动的作者。在我的职业生涯中,我深刻感受到数字化转型对企业未来发展的重要性,而数据治理能力是其中的核心。这几年,数字化浪潮席卷全球,企业对数据治理和管理人才的需求愈发迫切。作为数据治理领域的权威认证,CDMP被视为数字化转型中的必备利器。近期,2025年CDMP认证考试的时间表已经正式对外公布,这无疑是所有关注...

2024-12-24 08:24:29 833

原创 一文读懂《数据资产管理实践指南(7.0版)》

大家好,我是独孤风,大数据流动的作者。在数字经济迅猛发展的今天,数据已成为企业最重要的战略资源之一。为应对日益复杂的数据管理需求,确保数据的高效利用和安全合规,数据资产管理的重要性愈加凸显。2024年12月,由大数据技术标准推进委员会编制的《数据资产管理实践指南(7.0版)》正式发布,标志着数据资产管理迈入新的发展阶段。作为一份权威的指导性文件,该白皮书全面阐述了数据资产管理的理论基础、实践方法及...

2024-12-19 09:26:41 690

原创 AI与BI的火花:大语言模型如何重塑商业智能的未来

大家好,我是独孤风。在当今这个数据驱动的时代,企业对于信息的需求如同对于氧气的需求一般至关重要。商业智能(BI)作为企业获取、分析和呈现数据的关键工具,正在经历一场深刻的变革,而这一变革的催化剂正是大语言模型(如GPT-4)的崛起。传统的BI系统多依赖于结构化数据和预设的分析路径,其在处理复杂非结构化数据方面显得力不从心。而大语言模型以其卓越的自然语言处理能力和深度学习技术,正在为BI注入新的生命...

2024-12-04 08:24:16 1174

原创 GPT时代的BI革命:智能报表系统如何颠覆传统决策

大家好,我是独孤风。在当今迅速发展的科技时代,人工智能(AI)与商业智能(BI)正携手引领一场前所未有的革命。随着大语言模型如GPT的崛起,传统的BI系统正逐步向智能化、自动化转型。本文将探讨如何通过引入智能报表系统,颠覆传统的决策流程,提升企业的敏捷性和精准度。我们将回顾BI的发展历程,考察AI在其中的深度应用,以及智能报表系统如何通过自然语言处理和对话式AI,帮助企业快速获取商业洞察。最后,本...

2024-11-29 08:24:20 1488

原创 数据血缘系列(19)—— 数据血缘技术实现之数据血缘可视化

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。数据血缘的可视化,作为一种将复杂数据流动过程图形化的手段,为企业提供了更加直观的理解方式。本文将深入探讨数据血缘可视化的工具、步骤以及图形库和框架,并结合数据治理的实际需求,详细分析这些要素如何协同作用以提高数据管理效率。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点...

2024-09-05 08:24:36 1894

原创 国际数据治理认证训练营(CDMP证书)(2024年9~10月)开放报名,北京上海可线下考试...

大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动的作者。2023年10月25日,国家数据局正式揭牌。数据要素上升到一个新的高度,数据作为资产进入财务报表指日可待,数据已经成为和土地,劳动力,资本,技术并列的第五要素。而数据要素的上一步就是数据治理,数据只有经过治理才有进一步成为资产的可能。目前数据治理的相关人才还是非常奇缺的,而通过数据治理认证考试则是入门数...

2024-09-02 11:07:44 470

原创 数据血缘系列(18)—— 数据血缘技术实现之数据血缘建模

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。数据血缘建模是数据治理和管理中的一个关键环节,它涉及将数据的流动、处理过程及其关系系统化,以确保数据的完整性、一致性和准确性。在数据血缘建模中,三个主要的步骤——概念建模、逻辑建模和物理建模——扮演着至关重要的角色。本文将详细探讨数据血缘建模的关键技术和方法,并深入分析这些步骤...

2024-08-30 08:25:00 1203

原创 数据血缘系列(17)—— 数据血缘技术实现之数据血缘采集

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。数据血缘的建设过程中,数据采集是基础而核心的一环。这一阶段涉及从数据源获取数据,并将其转化为可用于血缘追踪的有用信息。数据采集阶段主要包括ETL技术应用和SQL解析应用两个方面。每一方面都在数据血缘的建立中发挥着重要作用,确保数据流动的透明性和追踪的准确性。本文为《数据血缘分析...

2024-08-27 08:24:12 1250

原创 数据血缘系列(16)—— 数据血缘三大应用场景

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。数据血缘分析作为数据治理中的核心组成部分,通过跟踪数据的来源、流向和变更,为数据管理提供了全面的视角。数据血缘不仅能够优化数据开发和资产管理,还能提升数据安全水平。本文将深入探讨数据血缘在数据开发、数据资产管理和数据安全三个主要应用场景中的作用,并分析其带来的实际提升和优化。本...

2024-08-23 08:25:03 1156

原创 数据血缘系列(15)—— 数据血缘6步落地法

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。在明确数据血缘建设方式以后,就是具体的落地实现了,本文介绍数据血缘的6步落地法,可以按此步骤实现数据血缘的落地。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所示:六步法是建立数据血缘的...

2024-08-19 08:24:19 606

原创 数据血缘系列(14)—— 数据血缘三大建设方式与策略

点击上方蓝字关注我,了解更多内容大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。数据血缘落地困难重重,是引入开源系统、购买厂商平台,还是自建系统往往很难抉择,本文我们就来学习数据血缘实施的三大建设方式与策略选择。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛...

2024-08-15 08:24:16 927

原创 数据血缘系列(13)—— 数据血缘实施落地难点

点击上方蓝字关注我,了解更多内容大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。前文中我们已经了解了数据血缘的概念与原理,但是数据血缘落地困难重重。本文我们就来学习数据血缘实施落地难点。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所...

2024-08-13 08:24:41 484

原创 数据血缘系列(12)—— 数据血缘实现之5个层次,从采集到应用的全面解读

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。进行数据血缘的分析一定要注重全链路方式的构建,针对数据的全生命周期,主要包括血缘采集层、血缘处理层、血缘存储层、血缘接口层、血缘应用层这5个层次。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导...

2024-08-08 08:24:16 1432

原创 数据血缘系列(11)—— 数据血缘五大分类

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。在数据治理中,数据血缘分析是至关重要的一环。它主要涉及数据血缘5个分类,逻辑血缘、物理血缘、时间血缘、操作血缘、业务血缘。本文将深入探讨这5个分类的具体内容。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出...

2024-08-06 08:24:18 412

原创 数据血缘系列(10)—— 数据血缘3种实体之数据库血缘、数据表血缘和数据字段血缘...

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。在数据治理中,数据血缘分析是至关重要的一环。它主要涉及数据库血缘、数据表血缘和数据字段血缘三种实体。本文将深入探讨这三种实体的定义及其在数据治理中的作用,并结合具体实践原则进行阐述。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请...

2024-07-31 08:24:44 396

原创 数据血缘系列(9)—— 数据血缘分析框架之数据全生命周期管理

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。本文我们详细探讨下数据血缘分析框架的核心,数据全生命周期管理。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所示:数据是现代企业和组织的重要资产,是驱动业务决策和创新的关键。有效的数据治...

2024-07-29 08:24:46 534

原创 工信部电子标准院人工智能从业人员认证培训:提升AI专业水平的权威途径

在当今快速发展的人工智能(AI)领域,专业认证已成为衡量从业人员技术水平和能力的重要标准。工业和信息化部电子工业标准化研究院(以下简称“电子标准院”)颁发的人工智能从业人员认证证书,凭借其权威性和专业性,成为众多AI从业者追求的目标。本文将详细介绍即将在青岛举办的《自然语言及语音处理设计开发工程师》(中级)专项培训,探讨其重要性、课程内容及认证的价值。培训背景及重要性随着人工智能技术的迅猛发展,A...

2024-07-26 08:24:28 735

原创 数据血缘系列(8)—— 数据血缘与指标数据

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。本文我们详细探讨下数据血缘与指标数据有什么关系?他们之间又是如何配合实现数据治理的。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所示:数据治理中的指标数据:概念与特征在数据治理领域,指...

2024-07-25 08:24:21 603

原创 数据血缘系列(7)—— 数据血缘与业务数据

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。本文我们详细探讨下数据血缘与业务数据有什么关系?他们之间又是如何配合实现数据治理的。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所示:业务数据的概念与特点在企业的运营过程中,业务数据,...

2024-07-22 08:25:00 1001

原创 数据血缘系列(6)—— 数据血缘与主数据

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。本文我们详细探讨下数据血缘与主数据有什么关系?他们之间又是如何配合实现数据治理的。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所示:主数据的概念与特点主数据是企业运营中不可或缺的核心数...

2024-07-18 08:24:19 814

原创 数据血缘系列(5)—— 数据血缘与元数据

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。本文我们详细探讨下数据血缘与元数据有什么关系?他们之间又是如何配合实现数据治理的。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所示:元数据(Metadata)是描述数据的数据,它为...

2024-07-16 08:24:14 875

原创 一图看懂数字中国发展报告

大家好,我是独孤风。近日《数字中国发展报告(2023)》正式发布,《数字中国发展报告(2023)》详细分析了中国在2023年全面推进数字化发展的各项成就和未来展望。 整理思维导图如下:报告强调,2023年是全面贯彻落实党的二十大精神的开局之年,同时也是数字中国战略深入实施的重要一年。在党中央、国务院的高度重视下,数字中国建设取得了显著成效,涵盖了基础设施建设、技术创新、数据市场化、数字人才培养等多...

2024-07-15 08:24:38 1028

原创 数据血缘系列(4)—— 数据血缘的特点与相关概念

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。本文我们详细探讨下数据血缘的特点都有什么?对比一下数据血缘、数据关系、数据分类、数据出处、知识图谱相关概念的关系。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。本文思维导图如下所示:在数据治理领域,数据...

2024-07-12 08:24:31 908

原创 数据血缘系列(3)—— 数据血缘可视化之美

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一,而数据血缘正是数据治理成功的一个关键。本文我们详细探讨下数据血缘可视化是什么,该如何实现。并顺便对比一下Apache Atlas 、Datahub、Openmetadata、Marquez、SQLLineage、Amundsen的数据血缘展示,感受一下数据血缘可视化之美。本文为《数据血缘分析原理与实践 》一书读书笔...

2024-07-10 08:24:24 839

原创 数据血缘系列(2)——什么是数据血缘?

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一。对于数据血缘的定义,一直都有争论,本文我们详细探讨下什么是数据血缘,并说明数据血缘能分析什么。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。思维导图如下所示:数据血缘,顾名思义,是描述数据从源头到目的地的路径及其变化的过程。通俗地说,数据...

2024-07-09 09:30:51 1070

原创 数据血缘系列(1)—— 为什么需要数据血缘?

大家好,我是独孤风。在当今数据驱动的商业环境中,数据治理成为企业成功的关键因素之一。本文我们详细探讨下为什么需要数据血缘,并说明数据血缘如何帮助企业解决关键问题,特别是在不同行业中的实际应用。本文为《数据血缘分析原理与实践 》一书读书笔记,部分观点参考自书中原文,如需更详细的了解学习,请大家支持原作者的辛苦付出。思维导图如下所示:数据血缘在现代数据治理中扮演着至关重要的角色,但其实现过程却面临诸多...

2024-07-08 08:23:59 341

原创 好书推荐《数据血缘分析原理与实践 》:数据治理神兵利器

大家好,我是独孤风。又到了好书推荐的时间。近几年来,国内数据治理蓬勃发展,数据的价值不断放大,数据正成为一种资产,也是新型的生产要素。数据血缘一词作为数据治理的一个核心概念,更是被频频提及。但是国内数据治理方面的书籍还是少之又少,大多数还停留在纯理论阶段,与实践,行业联系不够紧密。不过好消息来了,由国内两位专家作者 成于念与赛助力老师创作的《数据血缘分析原理与实践 》一书终于发表了,通读之后收获非...

2024-07-05 08:42:34 698 1

Minio入门宝典.pdf

开源对象存储方案 Minio入门宝典

2021-10-25

hadoop-aws-2.7.3.jar

hadoop-aws-2.7.3.jar,hadoop,spark查询oss对象存储包

2021-10-13

PyHive-0.6.4.tar.gz安装包,python连hive驱动

PyHive-0.6.4.tar.gz安装包

2021-09-03

apache-superset-1.3.0最新版本源码包

apache-superset-1.3.0最新版本源码包

2021-08-27

dbeaver最新包,21.1.5

连接mysql oracle hive 数据库工具

2021-08-27

instantclient-basiclite-linux.x64-21.3.0.0.0.zip

oracle client

2021-08-26

zookeeper全套包资源

zookeeper全套包资源

2021-08-25

cmake-3.2.3-Linux-x86_64.tar.Z

cmake-3.2.3-Linux-x86_64.tar.Z

2021-08-24

atlas 2.2.0源码包,apache-atlas-2.2.0-sources.tar.gz

atlas 2.2.0源码包,apache-atlas-2.2.0-sources.tar.gz,atlas是数据治理,元数据管理的老牌项目了,对于hive等hadoop的元数据管理都支持的比较好

2021-08-23

airflow python安装包,apache_airflow-2.1.2-py3-none-any.whl

airflow python安装包,apache_airflow-2.1.2-py3-none-any.whl

2021-08-18

airflow 2.1.0client 源码,apache-airflow-client-2.1.0-source.tar.gz

airflow 2.1.0client 源码,apache-airflow-client-2.1.0-source.tar.gz

2021-08-17

airflowclient的安装包 apache_airflow_client-2.1.0-py3-none-any.whl

airflow client 2.1.0,python pip安装包 apache_airflow_client-2.1.0-py3-none-any.whl

2021-08-16

apache-activemq-5.15.15二进制包,安装包

apache-activemq-5.15.15二进制包,安装包,apache-activemq-5.15.15-bin.tar.gz

2021-08-10

activemq-5.16.2-源码包,源码包资源

activemq-parent-5.16.2-source-release.zip,activemq-5.16.2-源码包

2021-08-10

activemq 5.15.15源码包,源码包

activemq 5.15源码包

2021-08-10

完整jar包资源,COULD NOT FIND stream,包缺失使用

打包找不到 stream COULD NOT FIND stream-2.5.2 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-09

完整jar包资源,COULD NOT FIND metrics-graphite,包缺失使用

打包找不到 metrics-graphite COULD NOT FIND metrics-graphite-3.0.0-BETA3 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-09

完整jar包资源,COULD NOT FIND metrics-ganglia,包缺失使用

打包找不到 metrics-ganglia COULD NOT FIND metrics-ganglia-3.0.0-BETA3 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-09

完整jar包资源,COULD NOT FIND metrics-core,包缺失使用

打包找不到 metrics-core COULD NOT FIND metrics-core-3.0.2 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-09

完整jar包资源,COULD NOT FIND metrics-core,包缺失使用

打包找不到 metrics-core COULD NOT FIND metrics-core-3.0.1 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-09

完整jar包资源,COULD NOT FIND high-scale-lib,包缺失使用

打包找不到 high-scale-lib COULD NOT FIND high-scale-lib-1.0.6 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-08

完整jar包资源,COULD NOT FIND jcommander,包缺失使用

打包找不到 jcommander COULD NOT FIND jcommander-1.48 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-08

完整jar包资源,COULD NOT FIND jcommander,包缺失使用

打包找不到 jcommander COULD NOT FIND jcommander-1.30 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-08

完整jar包资源,COULD NOT FIND AppleJavaExtensions,包缺失使用

打包找不到 AppleJavaExtensions COULD NOT FIND AppleJavaExtensions-1.4 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-08

完整jar包资源,COULD NOT FIND fastjson,包缺失使用

打包找不到 fastjson COULD NOT FIND fastjson-1.2.68 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-08

完整jar包资源,COULD NOT FIND reporter-config,包缺失使用

打包找不到 reporter-config COULD NOT FIND reporter-config3-3.0.0 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-07

完整jar包资源,COULD NOT FIND reporter-config,包缺失使用

打包找不到 reporter-config COULD NOT FIND reporter-config-2.1.0 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-07

完整jar包资源,COULD NOT FIND zkclient,包缺失使用

打包找不到 zkclient COULD NOT FIND zkclient-0.11 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-07

完整jar包资源,COULD NOT FIND zkclient,包缺失使用

打包找不到 zkclient COULD NOT FIND zkclient-0.8 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-07

完整jar包资源,COULD NOT FIND colt,包缺失使用

打包找不到 colt COULD NOT FIND colt-1.2.0 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-07

完整jar包资源,COULD NOT FIND tephra,包缺失使用

打包找不到 tephra COULD NOT FIND tephra-hbase-compat-1.0-0.6.0 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-06

完整jar包资源,COULD NOT FIND tephra,包缺失使用

打包找不到 tephra COULD NOT FIND tephra-core-0.6.0 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-06

完整jar包资源,COULD NOT FIND tephra,包缺失使用

打包找不到 tephra COULD NOT FIND tephra-api-0.6.0 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-06

完整jar包资源,COULD NOT FIND classworlds,包缺失使用

打包找不到 classworlds问题 COULD NOT FIND classworlds-1.1 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-06

完整jar包资源,COULD NOT FIND classworlds,包缺失使用

打包找不到 classworlds问题 COULD NOT FIND classworlds-1.1-alpha-2 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-06

完整jar包资源,COULD NOT FIND logback-classic,包缺失使用

打包找不到 logback-classic问题 COULD NOT FIND logback-classic:logback-classic-1.1.3 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-05

完整jar包资源,COULD NOT FIND logback-classic,包缺失使用

打包找不到 logback-classic问题 COULD NOT FIND logback-classic:logback-classic-1.1.2 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-05

完整jar包资源,COULD NOT FIND logback-core,包缺失使用

打包找不到 logback-core问题 COULD NOT FIND logback-core:logback-core-1.1.2 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-05

完整jar包资源,COULD NOT FIND logback-core,包缺失使用

打包找不到 logback-core问题 COULD NOT FIND logback-core:logback-core-1.1.3 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-05

完整jar包资源,COULD NOT FIND cglib,包缺失使用

打包找不到 RING-CORES问题 COULD NOT FIND cglib:cglib-2.2.2 解压后将jar包与pom文件都放在.m2\repository指定路径下

2021-08-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除