自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 数据质量平台--火山引擎

在数据发生变动的时候,如更改数据 Schema、变更数据源等,需要对变更前后的数据进行对比,通过量化评估两份数据的差异,来避免变更导致的数据变化影响数据下游正常使用的情况发生。通过数据对比功能,对新旧数据表到字段级进行差异量化对比,精确衡量数据变动的影响,为数据责任人提供参考依据。产品提供了以下两种模式进行对比。表:对比的对象为两张已持久化到 Hive 的 A 表和 B 表。SQL:对比的对象为两段 SQL 产出的虚拟数据集,该数据尚未持久化到 Hive 表。

2024-09-14 15:35:06 1117

mysql客户端安装-仅Windows安装版

mysql客户端安装-仅Windows安装版

2024-09-25

day03供应链管理系统.rar

该文档提供了一个关于供应链管理系统开发的详细指南,重点介绍了项目安排、技术实现和框架搭建的相关内容。 文档分为以下几个关键部分: 项目安排:主要步骤包括搭建框架(1天),基础数据模块和权限管理(4天),以及应收应付和销售管理(5天)。 供应链概念:供应链系统的核心流程是通过采购商品放入仓库,并在销售时从仓库提取商品,涉及三个主要订单:采购订单、销售订单和调拨订单。 大数据的应用:介绍了数据挖掘、ETL(数据抽取)和BI(商业智能)在供应链管理中的应用。 技术实现:讲述了DAO(数据访问对象)的重用、服务层的重用、以及前端JS的继承机制、jQuery插件开发等技术细节。 系统框架搭建:包括Maven环境的配置、Web工程的创建、持久化类和映射文件的编写,以及Spring配置文件的实现。 DAO的需求和功能:供应链管理系统的各个模块都涉及分页查询、条件查询、删除、增加、修改操作等需求。 泛型的应用:通过示例说明了在Java语言中如何使用泛型来实现模块化和可扩展性。 文档非常技术导向,适合开发人员参考,用于构建供应链管理系统的架构和功能模块。

2024-09-24

day01供应链管理系统.rar

该文档提供了一个关于供应链管理系统开发的详细指南,重点介绍了项目安排、技术实现和框架搭建的相关内容。 文档分为以下几个关键部分: 项目安排:主要步骤包括搭建框架(1天),基础数据模块和权限管理(4天),以及应收应付和销售管理(5天)。 供应链概念:供应链系统的核心流程是通过采购商品放入仓库,并在销售时从仓库提取商品,涉及三个主要订单:采购订单、销售订单和调拨订单。 大数据的应用:介绍了数据挖掘、ETL(数据抽取)和BI(商业智能)在供应链管理中的应用。 技术实现:讲述了DAO(数据访问对象)的重用、服务层的重用、以及前端JS的继承机制、jQuery插件开发等技术细节。 系统框架搭建:包括Maven环境的配置、Web工程的创建、持久化类和映射文件的编写,以及Spring配置文件的实现。 DAO的需求和功能:供应链管理系统的各个模块都涉及分页查询、条件查询、删除、增加、修改操作等需求。 泛型的应用:通过示例说明了在Java语言中如何使用泛型来实现模块化和可扩展性。 文档非常技术导向,适合开发人员参考,用于构建供应链管理系统的架构和功能模块。

2024-09-24

TeamViewer远程控制软件

TeamViewer是一款广泛应用的远程控制和桌面共享软件,它允许用户通过互联网远程访问和控制另一台计算机。无论是在工作场所支持技术问题,还是远程协作处理任务,TeamViewer都提供了便捷的解决方案。其主要功能包括: - **远程控制**:用户可以通过TeamViewer远程操控他人的设备,进行故障排查、软件安装、文件传输等操作。 - **跨平台支持**:TeamViewer支持Windows、macOS、Linux、iOS、Android等多种操作系统,确保不同设备之间的无缝连接。 - **安全性**:采用端到端加密和双因素身份验证,确保远程连接的安全性和隐私保护。 - **文件传输**:可以在远程会话中安全地进行文件传输,支持大文件上传下载。 - **多用户会话**:可以同时连接多个远程计算机,方便团队合作和培训。 TeamViewer的简单界面和丰富功能使其成为IT支持、在线会议、远程培训等多种场景中的理想选择。

2024-09-24

统计学复习资料与考试指南

内容概要:这份统计学复习材料涵盖了从基本理论到高级的应用技巧,帮助准备《统计学》期末考试的学生理解和应用统计概念。主要包括统计数据的收集与分析方法、推断统计初步、数据特性描述、时间序列分析等,并探讨了统计指数分析以及相关和回归分析等重要内容。 适用人群:适用于正在修读统计学的大学本科学生及准备参加《统计学》期末考试的相关人士。 使用场景及目标:适用于《统计学》课程学习过程中,加深对学生对概念的记忆,提高对计算与应用的理解能力。 其他说明:复习材料还包含了不同类型题目,帮助考生熟悉并掌握各种可能出现的实际问题解决方法,助力考生应对即将到来的期末考核。

2024-09-20

香农信息论的创立与发展概述

内容概要:本文详细介绍了克劳德·香农及其创建的信息论的历史意义和发展过程。讲述了信息论的核心概念——'比特'和'熵'的起源及其对于通信理论的影响,并深入探讨了香农信息理论的应用范围、研究方向、目标及其对于通信系统的四大关键特性(可靠性、有效性、保密性和认证性)的影响,还简要描述了他的生活背景和他的科学贡献。 适用人群:通信技术研究人员、信息理论学者以及对信息科学历史有兴趣的人群。 使用场景及目标:帮助科研工作者深入了解香农信息论的发展历程和学术价值,并应用于改进信息传播和存储机制的设计中。 其他说明:通过对香农及其研究成果的深度剖析,为理解复杂系统内的信息流动提供了全新的视角。

2024-09-20

初等数论的知识点精讲及其实际应用

内容概要:本文从初等数论的基本知识点出发,依次介绍了整数的不同表示方法,尤其是 p 进位制系统;探讨了整数的诸多特性,涵盖了整除性、奇偶性分析以及与质数、完全平方数相关的内容;深入讲解了最大公约数和最小公倍数的计算方法与重要意义;并对同余关系进行了详细的剖析,包括欧拉、费马和中国剩余定理的介绍及应用实例。通过对经典问题的具体解释和证明方式展示,帮助读者建立起坚实的理论基础,并提高解决实际问题的能力。 适合人群:适用于高中生、本科生及初学者,尤其对那些准备参加数学竞赛的学生来说更具指导意义。 使用场景及目标:无论是用于自我提升,亦或是作为课堂教学的一部分,本文都将加深您对于整数及其特性的理解,并教会你怎样运用相关知识来探索复杂数论谜题的答案。 阅读建议:建议读者配合一定的练习题来进行阅读,以便更好地理解和掌握所述知识点。

2024-09-19

新零售:以数据为核心驱动力的新商业模式

内容概要:报告阐述了新零售这一新型零售形式的关键理念和技术背景,强调以消费者为中心和以数据为动力来塑造未来的零售模式。提出了‘人-货-场’的重组视角,并讨论了如何利用数字技术,如大数据、移动支付、物流等基础设施建设,在满足消费需求的基础上,促进整个产业链的转型升级。 适合人群:企业高管和经理,尤其是零售行业的相关人员。 使用场景及目标:帮助企业了解零售业的发展趋向,并依据所掌握的内容来优化现有的业务流程、供应链管理和市场营销策略。 其他说明:本报告还展望了新零售的发展前景,包括短期的目标实现以及未来三十年甚至更长远的发展路线图。

2024-09-19

数据质量平台的功能及应用介绍

内容概要:介绍了数据质量平台火山引擎的主要功能和应用场景。包括数据量、个性化的数据监控及警告机制,任务发布时的质量监测及熔断能力,以及修改流程中的数据对比方法。它不仅有助于检测并修正各种常见的错误还能够在任务修改流程中对比线上线下数据的变化。另外还特别强调了一些实用的操作指南,如探查功能的具体操作,如何管理探查结果以及如何新建对比。 适用人群:数据工程师,数据科学家以及负责数据质量管理的专业人士。 使用场景及目标:适用于那些需要高效的数据质量保证,确保数据的可靠性以及一致性,以及及时发现问题和解决数据质量问题的工作环境或业务。 其他说明:这个工具主要应用于任务发布和修改时的质量验证,数据探查等情境下,在提升数据分析效果、降低数据风险上有明显的价值。

2024-09-14

快手数据治理之道:始于模型规范

内容概要:详细介绍了快手进行数据治理时所采用的一系列方法论和技术工具,特别是如何自数据建模之初就开始贯彻规范化与标准化的方法。这种从源头上把控数据质量的方式帮助构建了高效而可靠的大数据分析环境。 适合人群:对企业数据治理体系感兴趣的IT工作者、数据分析师、架构师以及管理人员。 使用场景及目标:对于正在建立或是优化自己公司内部大数据管理流程的企业来说非常实用,可以从本案例中学到宝贵的经验教训,尤其是在如何制定并执行统一的数据标准方面。

2024-09-14

常见的三类聚类分析介绍

常见的聚类分析方法包括 K-Means 聚类、层次聚类、密度聚类等。 K-Means 聚类是一种基于距离的算法,通过不断迭代优化类簇中心,使得数据点到所属类簇中心的距离之和最小。 层次聚类则构建一个层次结构,逐步合并或分裂类簇。 密度聚类则是根据数据点的密度来确定类簇。

2024-08-17

使用SPSS进行数据分析

文档主要介绍了SPSS的SYNTAX语法规则及其应用,对于学习SPSS数据分析的人来说具有一定的参考价值。同时,文档还介绍了SYNTAX语法的一些特殊情况和应用技巧,对于掌握SYNTAX语法的实际应用也有所帮助。

2024-03-10

如何写学术论文,怎么投?

如何写学术论文,怎么投?

2023-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除