- 博客(67)
- 收藏
- 关注
原创 Oracle存储过程怎么写
Oracle 存储过程(Stored Procedure)是存储在数据库中的一组预编译 SQL 和 PL/SQL 代码块,用于封装复杂的业务逻辑。以下是完整的编写指南,包含以及。
2026-03-13 18:25:18
225
原创 证券业务知识经验(1)
指标名称核心公式逻辑优点缺点/风险适用场景日涨跌/幅(今收-昨收)/昨收直观反映当日盈亏除权日需特殊处理短线交易、每日复盘换手率成交量/流通股本判断主力动向、活跃度新股失真捕捉热点、判断顶部/底部振幅(最高-最低)/昨收判断日内博弈激烈程度无量化策略、波动率分析流通/总市值价格 × 股本衡量公司规模受股价波动影响大选股池筛选(如只选大盘股)静态 PE市值 / 去年净利数据确切严重滞后长期稳定增长型公司参考PE TTM市值 / 近4季净利平衡了时效性与准确性。
2026-03-13 14:15:32
422
原创 ClickHouse的介绍
选 ClickHouse 如果:你需要处理海量数据(亿级以上),主要做复杂的聚合分析,对查询延迟极其敏感(要求秒级出结果),且数据主要是追加写入,不需要频繁的单行更新或强事务保证。不选 ClickHouse 如果:你的系统是交易型(如电商下单、银行转账),需要频繁的随机更新/删除,或者需要极高的并发点查(如根据 ID 查用户详情)。此时应考虑 MySQL、PostgreSQL 或 Doris/StarRocks。
2026-03-12 16:17:42
371
原创 大数据处理与分布式存储的各自介绍
未来的大数据架构将不再是单一的Hadoop生态,而是向着云原生、存算分离、实时化、智能化的方向发展。存储层:对象存储将成为绝对底座,湖仓一体格式(Iceberg等)屏蔽底层差异。计算层:Flink统领实时与批量,Serverless让计算像水电一样按需使用。应用层:与大模型深度结合,数据不仅是报表,更是AI的智能记忆和决策依据。对于企业而言,构建**“实时湖仓一体 + 存算分离 + 云原生”**的架构将是未来3-5年的核心竞争力。
2026-03-12 15:13:38
279
原创 在医院的数据治理场景中,业务模型与数据模型的介绍
先理业务,后建数据:不要一上来就建表。必须先梳理清楚医院的业务流程图和业务术语字典(业务模型)。如果业务逻辑没理顺(例如:转科流程定义不清),建出来的数据模型一定是混乱的。标准化是灵魂:医院数据模型必须强依赖HL7 FHIRICD编码国家卫健委互联互通标准。脱离标准的自建模型会导致未来无法对接区域平台或进行科研合作。动态演进业务模型随医改政策(如DRG付费改革、电子病历评级)快速变化。数据模型需要具备灵活性(如采用NoSQL存储非结构化病历,或在关系型数据库中预留扩展字段)以适应业务变更。
2026-03-11 11:06:32
194
原创 什么是数据模型?与业务模型的关系
数据模型是信息系统的“骨架”。对于开发者:它是写代码、建表、写SQL的依据。对于管理者:它是确保数据资产清晰、可用、安全的基础。对于AI/大数据:高质量的数据模型是训练出好算法的前提(Garbage In, Garbage Out)。理解业务模型 ➡️ 画出概念模型 (E-R图) ➡️ 细化逻辑模型 ➡️ 落地物理模型 (建库建表)。
2026-03-11 10:20:37
346
原创 什么是业务模型
商业模式 (Business Model):更宏观,侧重于战略层面。它描述的是整个公司的盈利逻辑和市场定位(例如:Netflix 的订阅制模式)。业务模型 (Business Model / Operational Model):有时更侧重于执行层面或特定业务线。它描述的是具体业务是如何运作的,包括流程、数据流、组织架构和系统支撑。在IT和数字化转型中,“业务模型”常指业务流程与数据结构的抽象表达,用于指导系统设计(例如:电商的业务模型包含“用户-下单-支付-发货-售后”的全链路逻辑)。
2026-03-11 10:19:09
334
原创 OpenClaw相比其他AI工具有哪些优势?
特性OpenClawChatGPT / Claude (网页版)传统的 RPA 工具 (如 UiPath)核心能力主动执行(操作电脑/文件)被动回答(提供建议/代码)流程自动化(基于固定规则)部署方式本地优先(私有化部署)云端 SaaS(数据上传)本地/服务器 (配置复杂)灵活性高(自然语言驱动,动态调整)中 (受限于对话框)低(需预先编写固定脚本)隐私性⭐⭐⭐⭐⭐ (数据本地)⭐⭐ (数据上云)⭐⭐⭐⭐ (数据本地)上手门槛中 (需简单配置)低 (开箱即用)高(需专业开发/配置)
2026-03-10 15:48:22
502
原创 最近很火的openclaw是什么
OpenClaw 是什么?它是一个运行在你本地的、能帮你实际操作电脑的开源 AI 管家。适合谁?担心隐私、不想把数据上传云端的用户。希望自动化重复性电脑操作(文件整理、代码运行、数据抓取)的开发者/极客。喜欢折腾新技术、愿意承担一定风险以换取高度自定义能力的玩家。如果你之前在使用Claude CLI或WSL。
2026-03-10 15:47:06
354
原创 哪种js的去重方式针对百万级数据量级更高效
场景推荐方案Kettle 中 JS 去重(万级以下)双重循环(简单)Kettle 中 JS 去重(十万~百万级)Object 哈希法(本文推荐)生产环境百万级去重改用Sort rows步骤你当前的问题,用Object哈希法即可完美解决,既兼容 Kettle,又高效可靠。
2026-01-23 15:53:50
430
原创 TiDB的简单介绍
让开发者像使用单机 MySQL 一样,轻松驾驭 PB 级分布式数据库。对开发者:告别分库分表,专注业务逻辑对 DBA:自动扩缩容、自愈、可视化运维对企业:一套系统支撑交易+分析,降低 TCO(总拥有成本)🌐开源地址📚官方文档如果你正在面临MySQL 扩展瓶颈或需要实时分析能力,TiDB 是一个值得认真评估的现代化数据库解决方案。
2026-01-22 16:15:55
965
原创 Oracle存储过程与触发器的详细介绍
存储过程是一组预编译的 SQL 语句和 PL/SQL 逻辑,存储在数据库中。可被应用程序多次调用,提高性能、减少网络传输、增强安全性。触发器是与表/视图/数据库事件关联的 PL/SQL 程序。当特定事件(如INSERTUPDATEDELETE)发生时,自动执行。组件核心价值典型场景存储过程封装可复用业务逻辑批量处理、API 接口、复杂计算触发器自动化数据维护审计日志、自动时间戳、数据校验🌟记住存储过程 = 你主动调用的“函数”触发器 = 数据库自动执行的“监听器”
2026-01-22 14:52:29
805
原创 MySQL的权限管理的简单介绍
操作谁执行命令查看自己权限任意用户授予/修改权限管理员撤销权限管理员🔐核心原则权限管理 = 安全基石,务必遵循最小权限、明确范围、定期审计。
2026-01-21 17:55:17
757
原创 电商行业的数据中台案例
🔹把流量变成留量(从“买用户”到“经营用户”)🔹让每一次互动都产生价值(内容→交易→数据→优化)🔹让供应链更聪明(需求驱动供给,而非库存驱动销售)在流量红利消失的今天,数据中台是新消费品牌破局增长的“第二曲线”。其本质是一场从“经验驱动”到“数据驱动”的组织变革。
2026-01-21 14:57:20
650
原创 金融行业的数据中台案例分享
🔹让风险看得清(实时、全面、智能)🔹让客户懂得到(千人千面、场景化服务)🔹让决策做得快(数据秒级就绪,业务敏捷响应)数据中台是金融行业从“信息化”迈向“智能化”的必经之路。其成功不在于技术多先进,而在于真正打通了“数据→资产→服务→业务价值”的闭环。
2026-01-21 12:34:53
666
原创 数据平台与数据中台的详细介绍
维度大数据平台数据中台定位技术基础设施企业数据战略核心输出数据表、计算任务数据资产、数据服务用户数据工程师业务人员 + 产品经理成功标准系统稳定性、性能业务效率提升、收入增长演进关系数据中台的技术底座大数据平台的价值升华🌟终极目标让数据像水电一样,随取随用,驱动业务创新。先夯实大数据平台(存算能力)→ 再构建数据中台(资产+服务)→ 最终实现数据驱动业务。
2026-01-21 11:39:45
781
原创 大模型应用开发中Dify的介绍
Dify = 可视化 Prompt IDE + 企业级 RAG + 智能体编排 + 应用发布平台❌ “Prompt 调不好” → ✅ 可视化调试 + 版本管理❌ “知识库不准” → ✅ 深度文档解析 + 混合检索❌ “上线难运维” → ✅ 一键发布 API/Web/机器人如果你不想从零造轮子,又希望比纯 API 调用更可控,Dify 是目前中文生态中最值得尝试的大模型应用开发平台之一。
2026-01-16 17:34:20
837
原创 农业数据获取存在哪些主要困难?
农业数据困境 = 高成本 + 低质量 + 碎片化 + 专业壁垒 + 动态复杂性但正因如此,谁能率先构建高质量、标准化、可持续更新的农业数据闭环,谁就掌握了智慧农业的核心护城河。对于农业企业而言,不要等待“完美数据”,而应通过“小场景试点 + 人机协同 + 持续迭代”逐步积累数据资产——这正是大模型时代农业数字化的最大机遇。
2026-01-16 17:33:47
516
原创 农业数据共享机制如何逐步完善
阶段核心任务成功标志1. 破冰期建立信任,消除顾虑签署首批共享协议,无安全事件2. 验证期打造价值闭环参与方主动续用,数据量月增20%+3. 规模期标准化+制度化80%县域主体接入统一平台4. 生态期市场化自运转数据服务收入覆盖平台运维成本终极目标让农业数据像“水电”一样——安全、便捷、按需使用,用者付费,供者受益。不求一步到位,但求步步生根。从一个县、一种作物、一个场景开始,用真实价值撬动共享生态。
2026-01-16 16:02:10
608
原创 如何解决农业数据的碎片化问题
标准是基础,平台是载体,机制是动力,应用是引擎。1️⃣选准一个高价值场景(如“水稻病害联防”);2️⃣拉通关键参与方(农技站+合作社+无人机公司);3️⃣制定最小可行标准;4️⃣让参与者立刻获益(如减少农药成本)。通过“小闭环验证 → 价值驱动扩展 → 生态自运转”,逐步瓦解数据孤岛。农业数据的价值不在“大”,而在“通”——打通才有生命力。
2026-01-16 15:40:55
773
原创 Rag与RagFlow的区别
问题答案RAGFlow 是 RAG 吗?是,但它是 RAG 的企业级增强实现能用 LangChain 替代 RAGFlow 吗?小规模可以,但处理复杂文档(带表格/格式)时,RAGFlow 效果显著更好中小企业该选哪个?- 技术团队强 + 文档简单 → LangChain - 非技术主导 + 文档复杂 → RAGFlow📌一句话记住RAG 是“发动机原理”,RAGFlow 是“一辆 ready-to-drive 的汽车”。
2026-01-15 17:41:31
730
原创 构建知识图谱的落地实施方案
以下是一个的,适用于企业级应用场景(如智能客服、金融风控、医疗问答、企业知识管理等)。方案覆盖从需求分析到上线运营的完整生命周期,强调。
2026-01-15 17:07:49
941
原创 ORACLE里length和lengthb函数的异同点分别是
函数含义单位是否受字符集影响返回字符串的字符个数字符(characters)❌ 不受影响(只数“字”)返回字符串的字节长度字节(bytes)✅ 受数据库字符集影响LENGTH→Length ofCharactersLENGTHB→Length inBytes问题答案LENGTH返回什么?字符个数(如“你好” → 2)LENGTHB返回什么?字节长度(如“你好” → 6,在 AL32UTF8 下)哪个受字符集影响?LENGTHB受影响,LENGTH不受影响存储限制用哪个判断?用。
2026-01-15 11:43:23
323
原创 oracle的varchar2(200)和mysql的varchar(200) 最大支持的字节数和字符数都一样吗
问题答案两者最大支持字节数一样吗?❌ 不一样。Oracle 默认按字节,MySQL 按字符(实际字节更多)200的含义一样吗?❌ 不一样。Oracle 默认是 200 字节,MySQL 是 200 字符哪个更“安全”存多字节字符?✅ MySQL(按字符计数),Oracle 需显式写CHAR迁移时要注意什么?必须确认 Oracle 的VARCHAR2是BYTE还是CHAR!✅最佳实践建议Oracle:尽量使用避免歧义;MySQL:放心用VARCHAR(N),它天然按字符计数;跨库设计。
2026-01-15 11:20:33
994
原创 数据湖的构建实施方法论
数据湖 = 集中式存储 + 原始数据 + 多样格式 + 按需处理特征说明存储原始数据不做预清洗,保留源系统原始格式(JSON、CSV、日志、图像等)基于对象存储使用 AWS S3、Azure ADLS、GCS 等低成本、高可用存储读取时才定义结构,灵活性高支持多引擎Spark、Flink、Presto、Hive、ML 框架均可访问统一数据底座打破数据孤岛,支撑批处理、流处理、机器学习✅典型用例用户行为日志分析IoT 设备数据汇聚企业全域数据归集(ERP + CRM + 日志)
2026-01-15 09:13:01
966
原创 大模型应用中数据质量评估指标与统计分析工具的介绍
毒性检测 = 大模型应用的“免疫系统”它不是简单的“屏蔽脏话”,而是通过技术+策略+人工构建多层次安全防线,确保 AI有用且无害。在数据质量体系中,毒性检测属于“安全与合规性”维度的核心环节。忽视它,轻则用户体验受损,重则引发法律与伦理危机。因此,任何面向公众的大模型应用都必须集成可靠的毒性检测机制。Python 生态(最主流)“没有度量,就没有改进。” —— 数据质量必须可量化、可监控、可行动。目标推荐工具快速探查数据分布自动化质量测试大规模去重/过滤Datatrovedatasketch。
2026-01-14 09:58:53
759
原创 大模型应用中的完整的数据处理链路介绍
Garbage in, garbage out.” —— 在大模型时代,这句话比以往任何时候都更正确。自动化(可复现、可扩展)可审计(每步日志、样本抽样检查)安全合规(PII、版权、伦理)面向任务(预训练 vs 微调数据策略不同)只有经过精心设计和严格质检的数据,才能训练出可靠、有用、安全的大模型。
2026-01-14 09:57:30
925
原创 大模型中Rag的介绍
RAG 不是替代大模型,而是为其“外挂大脑”。它以低成本、高可控性的方式,将大模型的“通用智慧”与“专属知识”结合,是当前最实用、最落地的大模型应用范式之一。“不要微调模型来记住知识,而要用 RAG 让模型学会查找知识。对于企业而言,RAG 是构建安全、可信、可维护的 AI 应用的首选路径。
2026-01-13 16:28:00
787
原创 JavaScript脚本语言的简单介绍
一切皆对象,函数是核心,异步是常态。灵活性:动态类型 + 原型继承 → 快速开发;生态强大:NPM(全球最大包仓库)、React/Vue/Angular、Node.js;全栈能力:一套语言打通前后端。✅学习路径建议掌握 ES6+ 语法(let/const、箭头函数、Promise);理解异步与事件循环;熟悉 DOM 操作(前端)或 Express(后端);学习现代框架(如 React)。📌记住:JavaScript 不是“玩具语言”,而是构建现代 Web 应用的工业级工具。
2026-01-12 15:49:06
484
原创 Numpy库的基础概念和基本操作
用数组代替循环,用向量化代替逐元素操作。np.array()np.zeros().shape.dtypearr[行, 列]+ - * / **np.sum()np.mean()广播机制:自动对齐不同形状数组NumPy 是通往 Pandas、机器学习、深度学习的必经之路,建议动手多练习!
2026-01-12 15:46:45
466
原创 什么是多模态
模态 = 信息的感知或表达通道。模态类型示例视觉图像、视频、3D模型、深度图听觉语音、环境音、音乐语言文本、手写、OCR识别结果触觉/传感温度、压力、加速度(IoT设备)生物信号脑电(EEG)、心电(ECG)、眼动结构化数据表格、知识图谱、数据库记录多媒体:侧重内容呈现(如视频+字幕);多模态:侧重语义理解与跨模态关联(如“看到狗叫 → 理解这是‘狗’在发声”)。多模态是通向通用人工智能(AGI)的关键路径之一。
2026-01-08 13:41:43
953
原创 指标体系建设实施方法论
指标体系是一组围绕企业战略目标和业务场景,系统化设计的、相互关联的核心指标集合,用于衡量业务表现、监控运营状态、驱动决策优化。单个指标= “体温37℃”指标体系= “体温 + 心率 + 血压 + 呼吸频率” → 综合判断健康状况衡量产品/公司长期健康度的最核心指标应与用户价值和商业价值强相关公司类型北极星指标示例SaaS(如钉钉)月活跃用户数(MAU)电商(如淘宝)总交易额(GMV)内容平台(如抖音)日均观看时长金融(如支付宝)月活支付用户数。
2026-01-08 11:02:05
883
原创 Elasticsearch(ES)的基本概念、架构及基本使用介绍
Elasticsearch = 分布式 + 全文检索 + 实时分析 + 可视化它是现代数据栈中不可或缺的组件,尤其适合“写多查快”的场景。虽然不能替代关系型数据库,但在搜索、日志、监控等领域几乎成为事实标准。
2025-12-30 11:42:26
843
原创 StarRocks(SR)的基本概念、架构及基本使用介绍
StarRocks = 高性能 + 实时性 + 易用性 + 开源免费它解决了传统 OLAP “快而不全”(如 ClickHouse)或“全而不快”(如 Hive)的痛点,是当前国产开源 OLAP 引擎的标杆。替代 Kylin/Druid 的预计算;替代 ClickHouse 的复杂分析;构建统一实时数仓,那么StarRocks 是一个非常值得投入的技术选型。
2025-12-30 11:35:12
1304
原创 大数据行业中,什么是拉链表?具体怎么做?
在大数据行业中,是一种用于高效存储和管理的数据建模技术,尤其适用于需要记录历史变更、支持时间点查询的场景。它通过“拉链”方式将一条记录在不同时间段的状态串联起来,避免全量快照带来的存储浪费。
2025-12-26 14:09:21
620
原创 MySQL数据库专家级工程师给的职业化建议
无论处于哪个阶段,保持对数据的敬畏之心,脚踏实地钻研技术,同时抬头看路理解业务,你一定能在这个领域占据不可替代的一席之地。
2025-12-26 11:19:52
496
原创 Oracle专家级数据库工程师的认知与经验
Oracle 不是一个“配置完就不用管”的软件,而是一个需要持续关注、理解、呵护的“生命体”。你对它的理解越深,它就越稳定、高效、可靠。而你的价值,就体现在“别人搞不定的时候,你能搞定”。帮你分析一条慢 SQL设计一个备份策略解读一份 AWR 报告模拟一次故障恢复演练欢迎随时带着具体问题来问!成长路上,有人带,真的不一样。| Server Process | ← PGA(私有内存)
2025-12-24 17:21:37
924
1
原创 Oracle中如何监控SQL执行时间?
场景推荐方法实时查看谁在跑慢 SQL(查分析最近哪些 SQL 最耗时V$SQL按排序长期性能趋势分析AWR 报告深度诊断单条 SQL监控大事务/导入导出进度如果你能提供具体需求(例如:“我想知道昨天下午 3 点那条慢查询到底花了多久”),我可以给出更精准的查询语句。
2025-12-24 14:41:40
902
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅