自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(464)
  • 收藏
  • 关注

原创 漫画:数据仓库死了!

这家Spark起家的公司市值超过了1000亿美金,其在某种程度上代表了数仓的未来。我们要理解它,学习它,超越它!公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。GenAI:收购 MosaicML (2023)性能怪兽:Photon 引擎 (2021)Spark 革命与公司诞生 (2013)Delta Lake 诞生 (2019)缘起:伯克利Lab (2009)传统数仓死了,新的继承者当立。湖仓一体出世 (2020)进化完成:数据智能平台。竞争优势:中立与多云。以数据为中心的 AI。

2025-09-16 07:30:26 71

原创 很遗憾,大模型想直接搞定数据质量,根本不可能!

你是一个数据运维专家。请识别出其中所有定义模糊(例如,‘活跃’的定义)、存在歧义或缺少关键信息(例如统计周期、是否包含测试用户等)的地方,并以提问的方式,列出一个问题清单,方便我向业务方进行二次确认。在清洗数据时,模型可能会过度解读或错误关联,将正确的数据“清洗”成错误的数据(例如,错误地标准化一个罕见但正确的公司名称,或者在提取信息时张冠李戴)。这种“帮倒忙”的行为对数据质量是致命的。请按照['字段名', 'PII类型(如电话、邮箱、地址)', '敏感等级(高/中/低)', '判断依据']的格式列出。

2025-09-12 07:31:41 865

原创 AI智能体在2025年注定失败?

大家总觉得Agent最值钱的是那个聪明的“大脑”,但现实是,AI模型本身的工作量,可能只占全部开发的30%。答案是:那些还停留在PPT上,吹嘘“全自动、通用、一步到位”的神话,同时固守着脆弱的设计、忽视工程现实的Agent项目,注定失败。这意味着,“失败滚雪球”是一个不断变化的移动靶,而非静态的宿命。我们的目标,就是通过更先进的工程思想,让系统韧性的增长速度,跑赢任务复杂度的增长速度。让智能体尽量做一个专注的工具人,你给他一个明确的指令,他给你一个高质量的结果,然后立刻下班,绝不跟你多聊一句。

2025-09-09 07:30:52 268

原创 数据中台即将重生:智能数据中枢!

现在,他直接问Agent,Agent会自动进行多维度下钻分析,并回答:"主要原因是'促销活动B'于上周日结束,导致流量下滑30%。: 基于此框架,Agent在内部形成了一个清晰的分析计划:"OK,我要依次探查是'访客数'、'转化率'还是'客单价'出了问题,然后再对问题指标进行下钻。这是统一的数据基座,通过Iceberg/Hudi/Delta等开放表格式,实现对结构化和非结构化数据的统一管理,批流一体,存算分离。没有它,Agent面对海量数据就会产生"幻觉",所有的智能都将是不可靠的空中楼阁。

2025-09-03 07:31:02 882

原创 嘿,那个做数据的,你今天又背锅了吗?

谷歌更新了生图模型,不愧是NO.1,我重绘了这个数据治理漫画,大家鉴赏!公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第四幕:简单的"小事"第七幕:业务理解的鸿沟。第八幕:预算的"艺术"第九幕:文化的"革命"第十幕:成功的"模式"尾声:致敬"无用"的人。

2025-09-01 07:31:18 140

原创 很遗憾,ChatSQL,不会成功!

当深入剖析那些被ChatSQL“拒绝服务”的真实需求时,我们看到的不是简单的技术障碍,而是一道道人类智慧与组织“惯性”共同构建的壁垒。我们当前的目标,或许不是一个冰冷的、100%自动化的数据工厂,而是一个由AI赋能、但仍由人类智慧主导的、更高效、更精准的特定场景的数据分析作坊。我们可以改变自己,但改变不了体系,体系的改变需要时间,而这不是我们一只团队,一个企业,甚至一个行业所能改变的。我们一直以为我们需要构建一个先进的AI应用,但现在真正需要面对的,是企业长期以来积累的、根深蒂固的“

2025-08-25 07:45:42 460

原创 你在第几阶段?企业数据治理体系的五级进化论

公司在做数智化转型,提到数据治理的时候,强调了降本增效,我当时也挺困惑,现在豁然开朗,做啥事,都讲究个性价比,数据治理前期投资是让你启动,但一旦到了一定规模,还是要回归市场本质,一切向利润看齐。:在数据仓库、大数据平台的那个时代,我们其实也一直以"服务者"的姿态在做数据支撑,但那个时候提供的服务是被动的,局部的,零碎的,现在的服务则是主动的,全局的,融合的。成立了"市政府"(数据治理委员会),开始统一规划,修筑主干道(拉通数据),建立供水系统(数据仓库/平台),并制定交通法规(数据标准)。

2025-08-20 08:04:11 850

原创 别再堆砌数安工具了!它们救不了你的数据(附实践架构蓝图)

它能精准地告诉你,哪个存有L4级敏感数据的云数据库正在“公网裸奔”,让安全从“盲人摸象”变为“精准制导”。身份是新的安全边界。跨平台的DLP(数据防泄漏),集成CASB(云访问安全代理)/SASE(安全访问服务边缘),防止数据从云、网络、终端泄露。通过预设的“剧本”,自动执行事件调查和响应(例如,发现高危访问,自动禁用账号并通知管理员),极大提升响应速度(MTTR)。解释:数据安全的“全景地图”和“体检中心”。不仅要“防得住”(零信任),还要“用得好”(隐私工程),更要“建得快”(DataSecOps)。

2025-08-18 08:25:42 852

原创 很遗憾,数据中台的数据资产,无法入表!

数据中台将其核心的"信贷风控特征数据"定价为10元/次调用,而将普通的"客户基础信息数据"定价为0.1元/次。"你们声称平台每年能节约上亿的成本,但这份收益里,有多少是因为更换了更便宜的供应商(采购部功劳),多少是因为优化了生产线工艺(生产部功劳),又有多少是单纯因为市场需求变化?这些数据产品,由于其权责清晰、成本收入明确,反而更容易以"存货"或"合同履约成本"的名义入表。年末,信贷数据产品部门在计算其对外销售的"风控评分API"产品的"存货"成本时,将这笔高昂的"内部数据服务费"计入了成本。

2025-08-13 08:26:03 784

原创 20年实战,我只用这一张「用数据说话」框架图

有没有可能,大家只是因为被强制要求才上来“打卡”,而真正需要的数据,因为缺乏业务元数据和质量标签,依然找不到,也看不懂?例如,在一张复杂的数据架构图下面,直接写上:“结论:三大核心系统间存在47个重复的数据接口,每年造成约80万的额外维护成本。发现因为供应商信息不统一,同一物料,我们向其实为同一家供应商的不同分公司,支付了不同的价格。一个错误的源头数据,是如何像病毒一样,污染了下游的十几个系统,最终导致了一次严重的生产事故。我们定义的KPI,衡量的是无意义的“行为”,还是有价值的“结果”?

2025-08-11 07:30:31 554

原创 ChatGPT 5发布,它怎么理解数据治理?

写成规则、落实流程、固化到系统,并被持续审计——这就叫数据治理。组织与责任(Owner/Steward)|规则与标准|流程与监控|工具与台账(元数据、质量、权限、血缘)。它让数据在既定成本与风险约束下,可用、可控、可信,并且结果可复现、过程可审计。不是一次性清洗、不是上个工具、也不是把锅丢给IT;数据治理=把数据从“副产品”变成“可经营资产”的制度化协作。成本: 取数交付周期、重复建设占比、治理单笔成本。效用: 数据可发现时间、可用覆盖率、复用率;风险: 质量缺陷率、口径冲突率、违规访问率;

2025-08-08 12:03:24 105

原创 数据不一致是组织病,不是技术Bug

我的文章显然解决不了上面的问题,我只是在假设,管理者,如果真的想解决数据不一致问题,下面的内容,可以给你提供一些弹药和指引,但要不要做,愿不愿做,敢不敢做,那是你的问题。只有当企业真正理解并接受这一点,才能从永无休止的"救火"中解脱出来,构建起真正的数据治理体系,也只有在这个体系下,管理者才不会随波逐流,站在全局的角度下做出理性的选择。大家都在做利益权衡,直到某天突然爆了个雷,被迫彻底根治,因为这个时候不做的代价,不仅仅是那点数据不一致造成的业务损失,还包括不作为的其他成本。

2025-08-04 07:31:50 771

原创 ChatGPT竟然抄了我的思路,刚推出了Study Mode,激动啊!

其底层技术由一套定制的系统提示词驱动,这些指令基于对学习科学的长期研究,旨在促进用户更加深度地学习,包括鼓励主动参与、管理认知负荷、主动发展元认知和自我反思、培养好奇心,以及提供可行的支持性反馈。而是应该一步步引导用户思考,每次只问一个问题,帮助用户自己理解和解决问题,并在继续下一步之前,给用户回应每一步的机会。3. 一起练习:让用户总结内容,适时提问,引导用户“复述给你听”,或者通过角色扮演(例如,用另一种语言练习对话)来练习。比如,不是直接给答案,而是通过苏格拉底式的提问引导用户思考。

2025-08-02 11:29:35 306

原创 别再死磕大模型了!我们把ChatSQL准确率从5%拉到60%的深度复盘

从优化需求提交界面,到增加需求管理员的"标准化"环节,再到引入ChatSQL Agent实现自动处理,并在最后增设人工抽检与确认环节,形成了一个"人机协同"的全新闭环。我们只能退而求其次,要求需求管理员在审核环节对不规范的需求进行"翻译"和"补全",但这无疑增加了他们的工作负担,也改变了他们固有的工作模式。当时,即便是最前沿的开源大模型,其SQL生成能力也远未成熟。在模型能力达到新的瓶颈前,我们通过业务分类的方式,将需求和对应的数据资产进行"分区",以降低单次查询的复杂度。

2025-07-28 07:30:31 525

原创 漫画:人工智障

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。14、AI 对 AI。

2025-07-25 07:31:13 210

原创 少谈数据治理,多做点数据管理和数据执行,这才是王道!

比如针对领域数据开放不畅问题,领域管理部门完全可以不管,短期也没啥大影响,但今天慢8小时,明天慢16小时,积累多了,这个公司的数据管理水平就比对手落后一截,老板还在那纳闷呢,为啥别人总比我们快半拍,诸不知是领域数据管理部门不履职造成的。你看华为配置有50人呢,因此,后续还要增加...."现实世界里,没有那么多的地方需要高大上的企业数据治理,因为公司的组织架构设置大多时候就是权责匹配的,只有在流程的边界地带存在权力的真空,因此,老是要搞跨部门数据治理的企业,肯定是不正常的。

2025-07-21 07:31:23 495

原创 做了100件事,老板只回一句:和业务有啥关系?

我一般会这么回答:"因为X域和Y域数据标准不一,导致XX数据不一致,导致业务部门做分析的时候,经常无法从两域匹配到完整的数据,因此,我们通过数据标准化和实体对齐,现在数据一致性达到了99%....."因此,你不能只是回答"进度70%",还要说"主要完成了XX,YY工作,还余留2个风险AA/BB,需要老板资源支持,如果顺利,预计项目将在XX之前完成。你详细的介绍了企业数据资产的梳理方法论,讲述了你们是怎么实现了部门墙的打破,怎么实现了主数据的统一,并且列出了引以为傲的数据治理的系列成果,包括:。

2025-07-07 07:30:51 925

原创 我,年薪50万数据建模师,每天都在应验这23个诅咒

诅咒十三「AutoML真神」诅咒二十一「KPI魔咒」诅咒五「数据地狱·上」诅咒六「数据地狱·中」诅咒七「数据地狱·下」诅咒十「先射箭再画靶」诅咒十七「重复造轮子」诅咒十九「相关即因果」诅咒二十「规则>AI」诅咒二十二「模型公墓」诅咒三「面试造火箭」诅咒八「孤岛共和国」诅咒十一「全能战士」诅咒十五「不可解释」诅咒十八「技术选型」诅咒二十三「在路上」

2025-07-02 07:30:28 187

原创 老板又让我写方案,我脑子一片空白

下面,我来介绍一个PPT汇报的通用模版,它适用于任何领域,它是汇报的"道",掌握了这个道,你至少知道了应该从哪里开始思考,不要有所缺漏,你可以基于"道",沉淀你所属领域的特定方法。有些方案的策略则要极尽你所能,非常复杂,比如要你制定一个企业级的数据治理方案,你得靠分层匹配法或者你所知道的那些方法论,即从组织,制度,机制,流程,系统等方面入手。有些方案的策略是很容易给的,上级下达了一个明确的要求,你对症下药就可以了,即从目标反推,比如让你解决性能不足的问题,你作为架构师马上会想到架构上的各种优化策略。

2025-06-30 07:30:46 580

原创 用了AI两年,我的大脑开始生锈,到底错在哪里?

当我们意识到这种结构性差距的存在,一个关键的概念浮出水面——我们需要重新思考在AI时代,什么是真正的"认知公平",如何才能确保每个人都有机会成为AI的主人而非奴隶?当"快餐式使用"成为主流,那些有能力进行"深度使用"的人反而获得了更大的相对优势。他复盘了自己如何从"通宵啃论文"的专家,变成一个依赖AI生成代码和报告的"提问机器",并担忧自己正陷入"认知外包"的陷阱,深度思考的能力正在钝化。⏰ 当AI系统的设计目标是"最大化用户使用时长"而非"最大化用户成长",你的努力是否在与系统对抗?

2025-06-23 07:31:33 1038

原创 AI大模型技术架构图全解

最后,要承认,不同领域、不同专业背景的人在画AI架构图时,会侧重某个特定方面,比如搞工程的,会特别重视模型增强层和AI编排层,我这张架构图,在他们眼里,肯定是不够专业。现在AI大模型火热,每个人都想对大模型技术有所了解,至少想了解个大概,这个时候,读懂架构图就很关键。原始模型像素颜,增强后才能上妆见人,这一层是让AI从"能用"到"好用"的魔法层。因此,我在下面还特意附上了其它的大模型架构,供大家参考,也请分享给有需要的人。不同场景需要不同模型,这一层是模型超市,是企业的"AI资产库"。

2025-06-18 07:30:34 2094 1

原创 我画了25个数据治理者的自画像,荒诞啊!

数据治理者是跨学科者,身体由技术员(键盘)、法律人(法锤)、业务人(公文包)、分析师(放大镜)四部分拼接而成。数据世界像一头巨大的数据“豹子”,难以掌控,数据治理者从一个小洞里试图理解全局数据地图。数据治理者穿白大褂,面对各种"数据病患"(缺失值、重复值、异常值)进行紧急手术。数据治理者身后是奔腾而混乱的数据“羊群”,他们挥舞数据“法杖”试图驱赶入栏。数据治理者像武林盟主,召集各门派(业务、分析、IT)合修元数据秘籍。数据治理者在建设一个“数据民主广场”,每人都有数据权益证。

2025-06-16 07:31:09 469

原创 别再逼数据治理创造价值了,它做不到!

现在很多企业IT部门牵头搞数据汇聚和开放,业务部门要是没真正参与进来,没有责权利的明确,没有分层分级,没有详细的解释口径,没有透明的处理过程,没有有效的权限控制,你让大家怎么信这个数据的可用性、权威性、安全性?多年前的一个下午,你站在会议室里,面对着老板质疑的眼睛,你的那份关于数据治理如何构建组织、建立流程、汇聚数据,建立目录,然后开放的PPT,讲到一半就感觉讲不下去了。:数据整合后,你能看到更完整的画面,不同来源的数据能互相印证,矛盾少了,一致性高了,你对数据整体描述能力的信任就上来了。

2025-06-09 07:31:10 920

原创 从数仓到GPT时代,我用30张图总结了20年数据架构演进史

从1990年代的Oracle单体数据库,21世纪初的数据仓库,到2024年爆火的向量数据库;今天,当你掌握了这30种架构模式,你就拥有了30种解决问题的思路。典型代表:Teradata、Oracle Exadata、IBM Netezza。典型代表:Apache Doris、StarRocks、Druid。这30张图,不仅是技术的演进史,更是一代又一代工程师智慧的结晶。典型代表:Oracle、SQL Server、MySQL单实例。我曾经问过一位在大厂工作了15年的架构师:'什么是好的架构?

2025-06-03 07:31:39 813

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 187

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 336

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 283

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 268

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 195

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 182

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 296

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 128

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 133

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 215

原创 我,年薪50万的数据治理专家,成了全公司最“没用“的人?

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。第10幅:年度汇报·第三年。第9幅:年度汇报·第一年。第18幅:董事会报告出错。第20幅:自己的"成功"第3幅:第一次部门会议。第四幕:简单的"小事"第12幅:系统切换之夜。第七幕:业务理解的鸿沟。第13幅:财务数据治理。第八幕:预算的"艺术"第15幅:预算会议对比。第九幕:文化的"革命"第十幕:成功的"模式"第19幅:别人家的成功。第22幅:AI时代来临。尾声:致敬"无用"的人。第24幅:地下室的灯光。第5幅:数据泄露危机。第7幅:统一客户定义。

2025-05-28 07:30:26 209

原创 数据中台死了?错!它只是褪去了上亿的虚火

大家认识到,不存在一建就灵的"银弹",任何技术的成功落地,都离不开业务的深度参与、组织的配套调整、流程的持续优化以及文化的长期培育。当炒作的热度退去,市场的关注点才能从那些虚无缥缈的"风口"和花哨的"概念",回归到技术本身能否解决实际问题、创造真实价值上来。更重要的是,数据中台的实践探索,哪怕是那些不太成功的尝试,也为后续的数据架构演进提供了宝贵的"试错"经验。这种渗透不是简单的"换马甲",而是对原有"大一统"物理平台设想的扬弃和重构,更强调"逻辑能力中心"的构建,而非庞大的集中式实体。

2025-05-26 07:31:06 906

原创 漫画:“向量数据库 + RAG”到底是什么?看完秒懂!

是不是经常听到“向量数据库”、“RAG”这些高大上的词?感觉像是AI界的“黑话”,听得云里雾里?今天,我们用轻松幽默的漫画,带你三分钟看懂“向量数据库 + RAG”这对黄金组合,是如何给大模型装上“最强大脑”和“企业知识U盘”的!一个机智的“助教”,在大模型“考试”(回答问题)前,火速去图书馆把最相关的“秘籍内容”找出来,递给大模型做“参考”。一个存满了你公司内部“武功秘籍”(知识文档)的超级智能图书馆,能飞快找到语义相关的“秘籍页码”。公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。

2025-05-22 07:31:14 206

原创 数据治理,终究还是败在了人心

到那时,"亡羊补牢"的成本远超早期预防。如果业务部门仅被动接受IT或数据治理办公室制定的规则,而非作为核心需求方主动发起、主导和深度参与,数据治理就易脱离实际,沦为与业务运作格格不入的"空中楼阁"—技术完美却不解决痛点,甚至平添负担的"屠龙之技"。IT提供的不仅是"服务器和数据库",更是让业务人员得心应手管理、分析、应用数据的"精良武器"和孕育洞察的"肥沃技术土壤"。它的成功,是建立在对自身环境的清醒认知、对正确路径的精准选择,以及对组织、流程尤其是"人"的持续、艰苦卓绝的改造与提升之上的必然结果。

2025-05-19 07:31:18 787

原创 点“数”成金:三分钟读懂数据资产入表

传统财务报表可能没体现你家“数据金矿”的真正价值!国家新规来了,数据资产入表正式开启!跟小明和智库君,三分钟看懂如何点“数”成金!公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个。一、为什么要实施数据资产入表。二、数据资产入表实施步骤。第三步 治理和质量评估。第六步 会计确认与入账。第七步 会计确认与入账。第八步 持续管理与监控。第0步 组建跨界战队。

2025-05-14 07:31:54 185

原创 Claude画的55种BI图表,覆盖99%可视化场景,炸裂!

为你汇总了在商业智能(BI)中最常见、最实用、也最容易在主流可视化库/BI 平台里找到的可视化"形态",能够在99%的业务可视化场景中助您选择最适合的可视化形式。10多年前,我正负责报表门户的重构,对于首页应该展示什么内容犹豫不决,然后让UI/UE去设计几个DEMO页面。以上图形类型涵盖了商业智能领域99%的可视化需求,希望这份指南能帮助您在实际工作中选择最合适的数据可视化方式!事实上,指标墙只是BI可视化设计的一种,当年的我应该是孤陋寡闻了。⏱️ 9. 时间线 & 计划。🕸️ 8. 网络 & 关系。

2025-05-12 07:31:38 538

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除