西瓜汁大数据
码龄4年
求更新 关注
提问 私信
  • 博客:25,033
    问答:214
    动态:1,140
    26,387
    总访问量
  • 28
    原创
  • 233
    粉丝
  • 95
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
加入CSDN时间: 2021-09-07
博客简介:

H651883075的博客

查看详细资料
个人成就
  • 获得323次点赞
  • 内容获得6次评论
  • 获得290次收藏
  • 博客总排名41,353名
  • 原力等级
    原力等级
    3
    原力分
    270
    本月获得
    10
创作历程
  • 1篇
    2025年
  • 23篇
    2024年
  • 1篇
    2023年
  • 1篇
    2022年
  • 2篇
    2021年
成就勋章
TA的专栏
  • 帆软小技巧
    2篇
  • 笔记
    5篇
  • 字符串拼接
    2篇
  • 数据治理CDGA
    17篇
  • 练习
    1篇

TA关注的专栏 8

TA关注的收藏夹 0

TA关注的社区 5

TA参与的活动 0

兴趣领域 设置
  • Python
    python
  • 大数据
    hadoopmongodbspark数据库大数据数据仓库数据库架构数据库开发
创作活动更多

『技术文档』写作方法征文挑战赛

在技术的浩瀚海洋中,一份优秀的技术文档宛如精准的航海图。它是知识传承的载体,是团队协作的桥梁,更是产品成功的幕后英雄。然而,打造这样一份出色的技术文档并非易事。你是否在为如何清晰阐释复杂技术而苦恼?是否纠结于文档结构与内容的完美融合?无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

53人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

帆软-Reprot JS

决策报表 刷新某个报表快JS。决策报表 报错 重新加载JS。决策报表 全局刷新JS。
原创
发布博客 2025.05.09 ·
133 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

starrocks 2.5版本日期递增,实现对应序号

6. 对于每个展开的元素,计算一个新的日期:`DATE_FORMAT(date_add('2024-08-05',(unnest - 1)),'%Y-%m-%d')`。`进行拆分,形成一个整型数组:`cast(split(lpad('1',(days_diff('2024-08-27','2024-08-05')*2)-1,'1;2. 生成一个由1组成的字符串,长度为天数差的两倍减1:`lpad('1',(days_diff('2024-08-27','2024-08-05')*2)-1,'1')`。
原创
发布博客 2024.08.27 ·
1910 阅读 ·
6 点赞 ·
2 评论 ·
9 收藏

帆软 单元过滤空值计算直通率 所有单元格列的乘积

0]{len(K4)!=0},",","*") 将,号替换成 * 号。0]{len(K4)!=0} 用于 过滤单元格的空值。EVAL() 返回任意表达式的结果。
原创
发布博客 2024.08.10 ·
414 阅读 ·
3 点赞 ·
0 评论 ·
1 收藏

第十七章 数据管理和组织变革管理

实际的意思是:组织是死的,不存在变革的说法,人才是变革的因素实际的意思是:如果不考虑人的个性因素。你和我都有不同的需求。那样的话呢,大家的要求是一致的,变革就很容易了,那变革为什么那么难呢?因为每一个人的要求都不一样。
原创
发布博客 2024.08.03 ·
1016 阅读 ·
10 点赞 ·
0 评论 ·
12 收藏

第十六章 数据管理组织与角色期望

分散运营模式 优点:组织结构相对扁平,数据管理组织与业务线或IT部门具有一致性缺点:是让过多的人员参与治理和制定决策,实施协作决策通常比集中发布号令更加困难网络运营模式 优点:结构扁平、观念一致、快速组建缺点:需要维护和执行与RACI相关的期望集中运营模式优点:为数据管理或数据治理建立了正式的管理职位,且拥有一个最终决策人缺点:实施集中模式通常需要重大的组织变革混合运营模式优点:包含分散模式和集中模式的优点可以从组织的顶层制定适当的指导方向,并且有一位对数据管理或数据治理负责的高管。
原创
发布博客 2024.08.03 ·
401 阅读 ·
5 点赞 ·
0 评论 ·
5 收藏

第十五章 数据管理成熟度评估

是是一种基于能力成熟度模型框架的能力提升方案,描述了数据管理能力初始状态发展到最优化的过程。
原创
发布博客 2024.08.03 ·
1075 阅读 ·
22 点赞 ·
0 评论 ·
18 收藏

第十四章 大数据和数据科学

信息收敛三角数据科学数据科学将数据挖掘、统计分析和机器学习与数据集成整合,结合数据建模能力,去构建预测模型、探索数据内容模式。分析对比数据仓库主要用于描述性分析,提供事后的结论数据科学侧重于预测性和规范性分析,旨在为未来提供预测和决策支持。数据仓库关注已发生事情的总结,而数据科学强调对未来的洞察和预见。数据科学:预测性分析,洞察,未来可能会发生什么规范性分析,预见,我们该做什么才能保证事情发生数据科学的过程阶段。
原创
发布博客 2024.08.03 ·
964 阅读 ·
23 点赞 ·
0 评论 ·
16 收藏

starrocks2.5版本 实现字符串有序拼接

原始数据是 一行一行的,需要实现分组 合并TOP1,TOP2,TOP3 按顺序 直接用group_concat()函数在2.5版本是无法实现升序或者降序,所以我们可以通过合并数组 来实现升序或者降序,array_sort()系统默认升序, 如果需要降序的话可以通过reverse()来实现 通过以上的3个函数可以达到升序降序的效果;
原创
发布博客 2024.08.02 ·
549 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

第十三章 数据质量(重点)

与数据治理和整体数据管理一样,数据质量管理不是一个项目,而是一项持续性工作。重要的数据先开始。高质量数据:达到数据消费者的期望和需求定义评估的目标确定要评估的数据识别数据的用途和数据的使用者利用待评估的数据识别已知风险,包括数据问题对组织过程的潜在影响根据已知和建议的规则检查数据记录不一致的级别和问题类型量化结果与数据管理专员、领域专家和数据消费者会面,确认问题和优先级使用调查结果作为规划的基础11.7 开发和部署数据质量操作管理数据质量规则测量和监控数据质量。
原创
发布博客 2024.08.01 ·
945 阅读 ·
20 点赞 ·
0 评论 ·
9 收藏

第十二章 元数据管理(重点)

元数据最常见的定义是 "关于数据的数据" ,元数据相当于图书馆里面的目录卡片。
原创
发布博客 2024.07.31 ·
1492 阅读 ·
52 点赞 ·
0 评论 ·
17 收藏

第十一章 数据仓库和商务智能(重点)

预测未来将要发生的事情数仓是已经发生的,为了BI,大数据是AI 是做数据预测的SCD 渐变类的维度RapidMiner(AI 数据挖掘) -- 低代码 SQL星型模型:是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相来连接,不存在渐变维度,所以数据有一定的冗余。比如:销售数据仓库中的星型模型雪花模型雪花模型:当有一个或多个维度表没有直接连接到事实表上,而是通过其他维度表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型去除了数据冗余。比如:销售数据仓库中的雪花模型。
原创
发布博客 2024.07.27 ·
918 阅读 ·
25 点赞 ·
0 评论 ·
20 收藏

第十章 参考数据和主数据

管理共享数据以满足组织目标,减少数据的冗余相关风险,确保更高的质量,并降低数据的成本重点:对共享的数据。通过建设标准,从而提高数据的质量共享的数据,标准化建设,提高数据质量列表。最简单的参考数据是由代码值和代码描述组成的列表交叉参考数据列表。不同的应用程序可以使用不同的代码集表 示相同的概念。这些代码集可能有不同的粒度,或者具有相同的粒度、 不同的值。交叉引用数据集可以在代码值之间转换分类法。分类参考数据体系根据不同级别的差异性获取信息。本体。
原创
发布博客 2024.07.24 ·
891 阅读 ·
27 点赞 ·
0 评论 ·
22 收藏

第九章 文件内容管理

文件和内容管理是指针对存储在关系型数据库之外的数据和信息的采集、存储、访问和使用过程的管理文件管理没问题 难的是:内容管理 (因为NLP还不成熟) natural language processing结构化和非结构化数据都是需要管理的。
原创
发布博客 2024.07.22 ·
823 阅读 ·
10 点赞 ·
0 评论 ·
15 收藏

热爱生活可以吗?

发布动态 2024.07.18

第八章 数据集成和互操作

数据集成和互操作(DII)描述了数据在不同数据存储、应用程序 和组织这三者内部和之间进行移动和整合的相关过程。
原创
发布博客 2024.07.17 ·
1030 阅读 ·
8 点赞 ·
0 评论 ·
10 收藏

第七章 数据安全

数据安全包括安全策略和过程的规划、建立与执行,为数据和信息 资产提供正确的身份验证、授权、访问和审计。
原创
发布博客 2024.07.15 ·
1075 阅读 ·
6 点赞 ·
0 评论 ·
7 收藏

第六章 数据存储和操作

数据存储与操作包括对存储数据的设计、实施和支持,最大化实现 数据资源的价值,贯穿于数据创建/获取到处置的整个生命周期。
原创
发布博客 2024.07.11 ·
602 阅读 ·
18 点赞 ·
0 评论 ·
7 收藏

第五章 数据建模与设计(重点)

数据建模是发现、分析和确定数据需求的过程,用一种称为数据模型的精确形式表示和传递这些数据需求什么是建模:是指表结构的设计,表是用来存储数据的。
原创
发布博客 2024.07.10 ·
878 阅读 ·
11 点赞 ·
0 评论 ·
19 收藏

第四章 数据架构(重点)

数据架构的基本结构3部分:具体体现在架构构成中的组件组件之间的相互关系管理其设计和演变的原则数据架构的构件包括当前状态的描述,数据需求的定义,数据整合的指引,数据管控策略中要求的数据资产管理规范(简单的总结来说,数据架构构件首先要解决当下的问题,同时也要预测未来的问题)定义组织中数据的当前状态提供数据和组件的标准业务词汇确保数据架构和企业战略及业务架构保持一致描述组织数据战略需求高阶数据整合概要设计整合企业数据架构蓝图。
原创
发布博客 2024.07.07 ·
1148 阅读 ·
5 点赞 ·
0 评论 ·
16 收藏

第三章 数据治理(重点)

数据治理数据被恰当的管理而不是直接的管理数据数据治理相当于监督和执行的职责分离,如图所示数据治理不是一次性的行为,数据治理是一个持续性的项目集,以保证组织一直聚焦于能够从数据价值和降低有关数据的风险。理解数据管理大于数据治理,数据治理是数据管理的11分之1数据治理是对数据管理的管理数据治理并不是直接管理数据数据治理包括2个核心内容组织架构各种各样的规章制度要建立起来数据治理要与IT治理(软件,硬件等)区分开。数据治理仅聚焦于管理数据资产和作为数据的资产的数据(总结一句话就是数据治理就是管理数据)数据治理内容
原创
发布博客 2024.07.06 ·
1122 阅读 ·
13 点赞 ·
0 评论 ·
23 收藏
加载更多