自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

技术传感器的博客

分享技术心得 交流AI生成心得体会 新的AI技术交流学习等

  • 博客(60)
  • 资源 (6)
  • 收藏
  • 关注

原创 别再争“RAG已死”:长上下文时代,90% 团队真正做错的是架构分工

摘要: 长上下文与RAG(检索增强生成)并非替代关系,而是互补分工。长上下文擅长复杂理解(如跨文档推理),而RAG确保事实正确性与治理(如权限过滤、实时数据)。常见误判包括认为长上下文可完全取代检索,或仅依赖向量库即完成RAG。实际应用中,高时效、强权限、精确命中等场景仍需RAG。团队应分阶段验证:先测试长上下文基线能力,再针对性增强检索(如元数据过滤、混合检索),最终实现可审计的生产级系统。决策核心是“问题导向”,而非技术偏好,需通过评测集量化效果。行动建议: 立即建立评测集,对比长上下文与RAG的失败案

2026-03-27 17:47:13 300

原创 还在用 Siebel 的企业有福了:你们可能早就把企业本体配出来了

这也是为什么从去年开始,企业 AI 圈里“本体”“语义层”“知识图谱”“可解释推理”这些词又开始重新升温。因为它不再只按字面理解,而是按 BO、BC、Field、Rule 这些已经存在的业务语义来理解问题。如果只从技术名词上看,企业本体、知识图谱、语义层,和 Siebel 似乎不是一套语言。从这个角度看,很多企业不是“没有做本体”,而是早就用另一种名字,把本体的大头工程化了。因为 AI 最怕的不是没信息,而是同一件事在不同配置、不同系统、不同部门里说法不一样。

2026-03-24 20:30:00 462

原创 从本体到 FDE:企业 AI 真正缺的,不是再训一个模型,而是一支能把业务翻译成系统的团队

企业AI落地的关键:从本体到执行 当前,企业纷纷重视“本体”建设,希望为AI提供清晰的业务语义(如订单、库存等对象的定义),以解决通用大模型在企业场景中的“失真”问题。然而,许多项目陷入论证阶段,难以落地,核心原因在于缺乏**“翻译团队”**——能将业务需求转化为可执行系统的复合型人才(如FDE模式中的前沿部署工程师)。 FDE并非单一岗位,而是融合业务理解、系统架构和工程实施的能力组合,其价值在于: 拆解业务:将模糊需求转化为具体可验证的问题; 连接系统:将本体映射到真实数据和流程; 整合AI:确保模型建

2026-03-24 07:00:00 315

原创 *OpenClaw 常见 7 个错误用法总结:为什么很多人装上后仍然没有真正提效?

OpenClaw 现在在国内很火,但很多人真正遇到的问题,不是不会安装,而是已经接触到它了,却还没用对。很多人把一套 AI 工作系统,用成了一个更贵、更复杂的聊天框。真正拉开差距的,不是模型,也不是 skill 数量,而是工作区、工具闭环、记忆、自动化和多 agent 的顺序有没有搭对。本文直接拆国内最常见的 7 个错法,并给出个人开发者和小团队更适合的起步路径。

2026-03-21 18:00:00 320

原创 当AI开始自动跑你的CI,你准备好信任它了吗?

GitHub给 Copilot coding agent增加了可选设置,允许管理员跳过人工审批,直接运行由 agent 推出来的GitHub Actions workflows。真正值得关注的,不是少点一次按钮,而是AI coding agent开始从“改代码”进入“触碰执行链”的阶段。文章重点不是复述功能,而是解释这为什么会把团队带到新的工程治理问题上:workflow 分级、token最小权限、secrets 暴露面、`.github/workflows目录保护,以及必须继续保留 human gate

2026-03-17 19:45:00 382

原创 讲透OpenClaw 里的这些 `.md` 文件:它们分别负责什么、不能写什么、该怎么配,以及怎么一起工作

本文介绍了OpenClaw工作区中7个核心.md文件的正确使用方法,帮助用户避免常见误区。文章首先指出多数人容易将这些文件混为一谈,导致系统混乱。随后针对每个文件(AGENTS、SOUL、USER、TOOLS、IDENTITY、HEARTBEAT、BOOTSTRAP)分别说明其核心职责、典型内容和绝对不该包含的内容,并以代码助手场景为例给出具体编写建议。重点强调各文件应严格区分职责:AGENTS管工作流程、SOUL管人格风格、USER管用户信息、TOOLS管环境映射、IDENTITY管身份卡片、HEARTB

2026-03-10 18:00:00 812

原创 第七章:共生的未来:本体生态、行业标准与“数业融合“人才

本文探讨数字化转型中的核心挑战与未来方向。文章指出当前企业面临"应用孤岛"困境,提出标准化语义资产将成为未来竞争关键。作者分析企业不做标准化的三大隐性成本,介绍国际标准化进展,并给出参与生态建设的三大策略。针对人才需求,强调"数业融合型"人才的重要性,提出三年实施路线图。最后建议管理层关注可复用语义资产而非系统数量,并给出三条落地建议:明确业务对象Owner、完善跨系统流程、加入采购可迁移条款。文章认为语义资产将成为组织协作的基础语法,是AI与业务真正融合的前提。

2026-03-03 18:00:00 322

原创 第六章:重构竞争力:迈向以“业务语义层“为核心的企业IT新范式

本文探讨企业IT范式迁移中本体工程的重要性。传统"应用中心"模式导致协同成本高企,而新范式强调建立统一业务语义层,实现对象、关系、规则和审计定义的标准化。通过金融、医疗等行业案例证明语义统一的价值,并提出渐进式迁移路径:先试点高价值流程,新增需求优先复用语义层,逐步消化历史复杂度。实施需配套组织机制,包括语义变更评审、版本治理和复用优先等。文章建议企业从盘点高冲突对象入手,将语义资产复用纳入规范,认为未来企业IT竞争力在于可复用、可演进、可迁移的语义资产能力。

2026-02-28 19:15:00 1338

原创 第五章:慎始善终:国内企业落地本体工程的渐进式路线图

本文提出了国内企业落地本体工程的渐进式实施路线图,强调"先定结构后扩展"的核心原则。作者指出本体工程本质是组织工程而非技术项目,建议分三阶段推进:试点验证(8-12周)、场景复制(1-2季度)、平台治理(年度)。重点包括选择高频、跨系统、可闭环的MVP场景,建立业务与技术协同机制,采用双线账本评估收益,配置最小三角色团队。文章警示三大常见陷阱:全域起步、技术独奏、忽视治理,并给出四周起步清单。最终结论指出本体工程成功关键在于节奏把控,通过小闭环验证积累经验,避免后期大规模返工。

2026-02-26 18:15:00 1381

原创 第四章:从“数据管道“到“智能土壤“:本体如何孕育高质量AI与智能体

企业AI落地的核心在于构建业务语义层和执行控制机制,而非单纯追求大模型能力。文章指出,成功的企业AI需要建立四层架构(数据接入、业务语义、AI能力、执行控制),遵循三条红线(最小权限、高风险动作审批、全链路追溯),并通过本体层将业务规则转化为可执行逻辑。实施路径应从小闭环场景起步,先构建语义模型和执行链,再优化智能功能。典型案例显示,改造后的运维助手从"复读机"升级为可执行、可追责的智能系统。最终结论强调:企业AI必须优先满足可解释、可执行、可审计的要求,才能实现稳定落地。

2026-02-25 19:00:00 645

原创 第三章:赋能智慧空间:看本体论如何破解城市更新运营难题

本文探讨智慧空间运营中的核心难题:数据与执行脱节。作者指出,当前城市更新和园区运营的主要痛点并非数据缺失,而是"统一语义+执行链"的断裂,导致系统割裂、语义混淆和动作闭环失败。文章提出"本体论+动力层"框架,将其比作城市交通规则与调度中心,通过统一对象、关系和业务规则,实现从"可看"到"可管"的转变。实践案例展示了分阶段改造路径,并建议采用"三层账本法"评估项目价值。最终强调智慧空间的关键在于建立可执行的运营

2026-02-15 18:00:00 655

原创 第二章:解剖“数字孪生“:语义层定义世界,动力层驱动世界

本文区分了"展示型数字孪生"与"可执行数字孪生"的本质差异,提出数字孪生的核心价值在于"可解释+可执行+可审计"。文章构建了"语义层+动力层"的双层模型:语义层负责定义对象、关系、状态和规则,动力层负责事件识别、规则执行和动作闭环。针对企业实施中常见的"能看不能用"问题,作者指出关键在于统一语义模型和打通执行链路,并给出了从术语统一到智能进阶的落地顺序。最后强调验收应关注效率、质量和治理三组核心指标,而非仅看

2026-02-14 18:00:00 465

原创 第一章:数字化转型的“阿喀琉斯之踵“:数据孤岛与业务割裂

摘要: 企业数字化转型的核心痛点并非技术不足,而是缺乏统一的业务语义层,导致数据孤岛问题难以解决。不同系统间的数据定义不一致(如客户、订单等),使得跨部门协同效率低下。破局关键在于构建"可执行的业务词典"(本体论),通过明确对象、关系、规则和责任,实现业务语义统一。建议90天内选择高频场景试点,建立最小语义词典并验证闭环效果,最终提升数据协同效率。真正的数字化转型重在组织与业务重构,而非单纯技术升级。

2026-02-13 18:00:00 32

原创 大模型从0到精通:对齐之心 —— 人类如何教会AI“好“与“坏“ | RLHF深度解析

摘要: RLHF(人类反馈强化学习)技术通过监督微调、奖励模型和强化学习三步,将大模型从“知识渊博但危险”转变为“有用、诚实、无害”的AI助手。预训练模型如“野生天才”,虽掌握海量知识却缺乏社会规范。RLHF通过人类标注的高质量数据训练奖励模型,指导AI生成符合人类价值观的回答,并利用PPO算法优化输出。实际案例显示,RLHF显著提升客服助手的用户满意度(65%→92%)并降低有害回答率(8%→0.3%)。但该技术仍面临奖励黑客、价值观冲突等挑战,需通过多维度奖励和持续优化解决。 关键词:RLHF、AI对齐

2026-02-11 18:00:00 572

原创 大模型从0到精通:从心算到动手 —— 思维链与智能体如何突破“文本预言家“的局限

摘要:本文探讨了大语言模型从基础问答到多步推理再到智能助理的演进过程。首先指出早期模型在简单问答(如首都问题)表现良好,但在多步推理(如鸡蛋计算)和实际任务(如查天气)中存在局限。随后介绍了"思维链"技术如何通过引导模型显式展示推理步骤来提升复杂问题解答能力。最后阐述了智能体如何整合大模型、工具、规划和记忆四大组件,实现从"知道"到"做到"的跨越,并以订机票和电商数据分析为例展示了智能体的实际应用价值。文章揭示了AI从语言模型向行动系统发展的技术路

2026-02-10 18:00:00 563

原创 大模型从0到精通:千人绘一图 —— 如何将千亿参数的巨兽拆解到上万张显卡上训练

大模型训练面临单卡显存不足的核心矛盾,分布式并行技术成为关键解决方案。数据并行通过复制模型、分发数据实现计算加速,但不减少单卡内存;模型并行拆分模型层到多卡,但存在流水线瓶颈。实践中采用混合并行(数据+模型+张量并行)结合ZeRO优化器的分片策略,显著降低显存需求。实际案例显示,通过合理配置并行策略,30亿参数模型可在32张GPU上高效训练,吞吐量提升26倍。分布式训练仍需解决通信开销、容错性等挑战,而3D并行、MoE等前沿技术持续推动千亿级模型的训练效率。

2026-02-09 18:00:00 994

原创 大模型从0到精通:从蒙眼走路到智能越野 —— 优化器如何为每个参数定制“步伐“

本文系统介绍了深度学习优化器的进化历程,从基础SGD到Momentum再到Adam,重点分析了Adam优化器的核心原理与优势。通过实验数据对比,展示了Adam在收敛速度(比SGD快3倍)和模型性能(准确率提升2.4%)上的显著优势。文章深入剖析了Adam的自适应学习率机制、动量积累和偏差修正等关键技术,并提供了优化器选择指南。最后讨论了大规模训练中的优化器挑战及前沿进展,为深度学习实践者提供了全面的优化器应用参考。

2026-01-03 18:00:00 817

原创 大模型从0到精通:学其神,而非形 —— 如何防止AI成为“死记硬背的刷题家“

《防止AI"死记硬背":正则化技术解析》摘要 本文通过电商评论情感分析项目的真实案例,揭示了过拟合问题的本质:模型在训练数据上表现完美(99.8%准确率),却无法应对真实场景中的新变化。文章将过拟合比喻为"高分低能"的学生现象,并系统介绍了三大正则化解决方案: Dropout:通过随机屏蔽神经元强制模型学习冗余特征,提升泛化能力 权重衰减:在损失函数中加入参数惩罚项,促使模型寻找简洁解决方案 早停法:基于验证集表现及时终止训练,避免过度拟合 实践表明,组合使用这些技术

2025-12-29 18:00:00 2105

原创 大模型从0到精通:大道至简 —— 如何用“预测下一个词“理解世界

原始的Transformer有编码器(理解)和解码器(生成),像翻译官的两部分。但GPT系列发现,对于生成式语言模型,一个庞大的、堆叠的解码器就足够了。这是为什么?

2025-12-25 20:30:00 1278

原创 大模型从0到精通:秩序与稳定 —— 给并行世界加上“时间戳“和“稳压器“

本文探讨了Transformer模型中的两个关键问题及解决方案:1)自注意力机制丢失顺序信息的问题,通过位置编码为每个词添加独特的位置信号来解决;2)深层网络训练不稳定的问题,通过层归一化技术对每层输出进行标准化处理。文章详细解释了正弦余弦位置编码的数学实现和层归一化的操作原理,并通过水渠灌溉等比喻生动说明其作用。实验表明,结合位置编码和层归一化可使24层Transformer模型的翻译性能提升44%,训练时间缩短1天。这些"幕后技术"与自注意力机制协同工作,共同构成了Transform

2025-12-24 18:30:00 1865

原创 大模型从0到精通:一眼万年——自注意力机制如何实现“全局洞察“

本文探讨了自注意力机制如何突破传统RNN/LSTM的顺序处理限制,实现并行全局理解。传统方法需逐字处理且易遗忘远处信息,而自注意力通过"词大会"机制让所有词同时交互,每个词通过Query、Key、Value三张名片建立全局关系。多头注意力进一步扩展为多主题并行会议,显著提升了长距离依赖处理能力和计算效率。实际应用中,自注意力使模型训练速度提升12倍,效果提升38%。尽管存在计算复杂度高和位置信息缺失等局限,这一机制已深刻影响NLP、CV等多领域,标志着从顺序处理到并行全局理解的思维范式转

2025-12-23 19:15:00 1486

原创 大模型从0到精通:记忆的初探——RNN与LSTM如何让AI拥有“短期记忆“

本文探讨了传统神经网络缺乏记忆能力的问题,介绍了RNN和LSTM的工作原理及优缺点。传统网络如"金鱼脑"无法保持上下文连贯,RNN通过隐藏状态实现短期记忆但仍存在梯度消失问题。LSTM引入遗忘门、输入门和输出门三个"智能秘书"来管理记忆,显著提升了长序列处理能力,曾主导NLP领域。尽管LSTM性能优异,仍面临计算复杂度高、顺序处理等局限,为Transformer的出现埋下伏笔。理解LSTM的门控机制和历史地位,有助于把握序列建模的发展脉络。

2025-12-22 20:00:00 913

原创 大模型从0到精通:深度网络的阿喀琉斯之踵——信号在传播中的湮灭与风暴

上一章我们了解了激活函数如何给AI装上"转弯"的能力,但激活函数也带来了新的挑战:梯度消失和梯度爆炸。理论上,网络越深,能力越强。但为什么在Transformer出现前,人们无法有效训练几十上百层的网络?因为有两个"幽灵"在阻碍:梯度消失与梯度爆炸。

2025-12-20 12:00:00 1303

原创 大模型从0到精通:判断力的灵魂——激活函数如何让AI“转弯“

本文深入浅出地介绍了神经网络激活函数的核心作用与典型类型。激活函数作为神经网络的"非线性判断官",通过Sigmoid、Tanh和ReLU等不同处理方式,使AI具备了拟合复杂模式的能力。其中,ReLU因其简单高效成为现代深度学习的默认选择,而Sigmoid和Tanh则更适合特定场景。文章通过奶茶销量预测等生动案例,阐明了激活函数如何将线性模型升级为"曲线思维",并提供了实用的激活函数选择策略。最后预告了深度学习中的梯度问题,为后续内容埋下伏笔。

2025-12-18 19:33:24 1218

原创 大模型从0到精通:误差反向传播——神经网络中的“责任追溯”系统

本文是《大模型从0到精通》系列"奠基篇"的收官章节,重点讲解神经网络中的反向传播算法。文章通过公司责任追溯的类比,形象解释了反向传播如何利用链式法则将输出层误差精确分摊到每个参数。内容涵盖前向传播复习、反向传播四步计算流程、矩阵形式的实现、常见问题(梯度消失/爆炸)及解决方案,并阐述了自动微分框架的实践意义。全文强调反向传播作为深度学习核心算法的重要性,它使深层网络的参数调整成为可能,是数学原理解决工程难题的典范。

2025-12-17 19:45:00 1111

原创 大模型从0到精通:从直线到万能曲线拟合器——神经网络的本质

本文介绍了神经网络如何通过分层结构和非线性激活函数突破线性模型的局限,实现万能曲线拟合能力。文章首先指出线性模型只能拟合直线关系的缺陷,随后引入神经网络的核心思想:通过多个线性公式分层协作,并借助ReLU等激活函数引入非线性,使模型能够拟合复杂曲线。文中详细讲解了两层神经网络的结构和工作原理,强调其通过分段线性组合逼近任意函数的能力,并指出深度网络通过层次化抽象实现更强表达力。最后,文章简要提及神经网络训练中的梯度下降方法,并预告下一章将深入讲解反向传播算法。全文以直观比喻和示例帮助读者理解神经网络的基础概

2025-12-16 18:45:00 1381

原创 大模型从0到精通:蒙眼下山法-AI如何一步步“摸索”到最优解?

本文是《大模型从0到精通》系列第一卷“奠基篇”的第三章。上章我们建立了“错题山谷”和评分标准(损失函数),但怎么找到山谷最低点?本章将引入——AI在“错题山谷”中蒙眼下山的寻路算法,这是驱动所有AI(包括千亿参数大模型)学习的核心引擎。

2025-12-15 19:30:00 887

原创 大模型从0到精通:错题本与得分卡 —— AI如何知道自己“错”了?

本文介绍了损失函数在AI模型训练中的核心作用。损失函数作为模型的"错题本"和"得分卡",能够量化预测误差,为优化提供明确目标。文章通过奶茶店销量预测案例,详细讲解了均方误差(MSE)的计算方法和特性,并类比为"错题山谷"的概念,形象展示了参数优化过程。同时对比了MSE、MAE等不同损失函数的适用场景,强调损失函数设计直接影响模型的"价值观"。文章指出,无论模型参数规模如何,损失函数的本质不变,都是将业务问题转化为数学优化问题。最

2025-12-12 11:49:33 1432

原创 大模型从0到精通:万能公式的诞生 —— 找到属于你的“a”和“b”

《大模型从0到精通》系列首章以奶茶店销售额预测为例,生动阐释AI模型的核心概念。文章通过线性模型y=ax+b,说明模型(计算框架)、参数(a和b)和训练(确定参数)的基本原理,将千亿参数大模型简化为"可调旋钮"的集合。通过真实数据拟合演示,揭示AI本质是数学拟合过程,参数即知识载体,规模决定能力上限。本章为后续讲解损失函数奠定基础,帮助读者建立"模型即带参数公式"的核心认知,理解从简单预测到复杂AI的扩展逻辑。

2025-12-11 19:30:00 1477

原创 RAG系统工业化实践:从原型到生产级的检索增强生成系统

RAG技术是企业AI落地的关键,它通过检索增强生成机制将大模型与企业私有知识库结合,解决了通用模型无法获取内部数据的痛点。RAG技术已从基础向量检索演进到智能多路检索阶段,包含数据预处理、智能检索和生成优化三大核心模块。生产级RAG系统支持多格式文档处理、多路检索策略和防幻觉检测,使企业能够构建基于真实数据的可信AI应用。

2025-12-08 19:30:00 1834

原创 TrendRadar:一款专注于软件类招投标信息的智能获取工具

一款功能强大、易于使用的招投标信息获取工具,能够帮助用户高效获取软件类项目的招标信息。通过配置关键词和监控平台,用户可以灵活调整关注的项目类型和来源。

2025-12-05 14:38:30 1744

原创 智能体开发框架深度解析:从“工具调用“到“自主业务员“的进化之路

AI智能体正从被动响应迈向主动执行,成为AI应用的终极形态。本文系统梳理了智能体技术的演进路径:从单智能体(2022-2023)到多智能体协作(2024),再到图式工作流(2025)。对比分析了主流框架(LangChain、CrewAI、AutoGen)的特性和适用场景,LangChain适合复杂自定义工作流,CrewAI擅长结构化多智能体协作,AutoGen则侧重对话式交互。文章还详解了构建可靠智能体的五大核心设计模式:ReAct推理模式、反思改进模式、任务规划模式、工具调用模式和多智能体协作模式,为开发

2025-12-04 18:00:00 963

原创 模型微调实战方法论:用5%的成本,获得80%的专用性能——中小企业专属模型锻造术

模型微调不是大公司的专利,而是中小企业的AI民主化工具。它让你能够:用通用大模型的基础能力结合你的专属数据和业务场景打造真正属于你的AI专家

2025-12-03 18:45:00 1584

原创 Prompt工程的艺术与科学:从“对话“到“编程“,掌握与大模型高效协作的元技能

摘要:Prompt工程通过结构化指令和思维链技术,使通用大模型在专业任务上接近微调模型效果,成本仅为1/10。文章系统阐述了Prompt工程的三个层次(基础对话、结构化指令、程序化交互),提供了可复用的模板库,并强调应像管理代码一样进行版本控制。研究显示,优化Prompt可使任务准确率提升20-30%,成本降低36%,建议企业建立Prompt管理系统,在简单任务场景优先采用Prompt工程而非模型微调。(149字)

2025-11-29 18:00:00 1301

原创 NLP与Transformer:理解下一代AI的“语言学革命“与“数学模型基石“

本文系统梳理了Transformer架构的发展历程及其在现代AI中的核心地位。从Word2Vec的词向量突破,到ELMo的语境化表示,再到Transformer的自注意力革命,文章详细解析了NLP技术的三次演进。重点阐述了自注意力机制的工作原理、多头注意力的优势,以及Transformer编码器-解码器结构的设计精髓。同时介绍了2024年最新进展,包括混合专家模型(MoE)和高效注意力机制。文章还从企业应用角度提供了模型选型指南和成本分析,强调理解Transformer架构对技术决策的重要性。最后通过Pyt

2025-11-28 19:00:00 1996

原创 大模型的“万能插座”:手把手教你用MCP搭建企业AI应用基石

过去,为每个AI项目都要为GPT、Claude、文心一言分别写一套不同的Function Calling代码,冗长、易错、难以维护。现在,使用MCP,你只需为你的"数据库查询工具"或"内部API工具"编写一次MCP Server,就可以让它同时被所有支持MCP的模型和AI应用所调用。

2025-11-26 18:00:00 1317

原创 “数字员工”接管CRM:一场由具身智能引发的企业运营革命

具身智能CRM:从工具到数字同事的变革 传统CRM是被动记录工具,而具身智能CRM通过感知、思考、行动能力,进化为主动解决问题的"数字员工"。它包含八大核心智能体:客户服务官、营销专家、销售预测师、销售教练、客户官、订单管家、产品策略师和运营总监,分别承担不同职能。这些智能体通过实时数据分析和自动化决策,显著提升业务效率(如订单处理效率提升60%,客户满意度提高25个百分点)。实施路径分为试点、部门协同和企业级生态三阶段,最终形成虚拟公司运作模式。这一变革将重构组织架构,员工角色从操作者

2025-11-25 20:00:00 1131

原创 世界模型:AI圈最大的“骗局”,还是通往AGI的唯一道路?

一场关乎AI未来十年走向的终极对赌

2025-11-24 17:33:31 1400

原创 别再给AI喂“垃圾”了!手把手教你清洗企业数据,微调效果翻倍

高质量数据集不是简单收集的结果,而是经过系统"锻造"而成的。数据质量决定AI模型的上限,低质量大数据集反而不如高质量小数据集有效。文章提出四大黄金准则评估数据质量:一致性(统一标准)、准确性(信息正确)、完整性(覆盖场景)和多样性(表达丰富)。并给出三步梳理方法论:1)数据普查绘制"数据地图";2)清洗标准化处理;3)构造优质问答对进行数据增强。通过量化评估体系和边缘案例挖掘技术,企业可将数据转化为无法复制的战略资产。

2025-11-23 18:00:00 703

原创 RAG与MCP:AI应用的两大基石,一文讲透如何选择

摘要: MCP(Model Context Protocol)与RAG(Retrieval-Augmented Generation)是构建智能AI系统的两种互补技术。RAG擅长处理非结构化文档(如企业知识库),通过语义检索提供知识回答;而MCP连接数据库和API,支持实时查询和业务操作。实践表明,RAG在静态文档处理上性价比高,MCP则在实时数据和工作流中更高效。二者并非替代关系,而是可以协同工作:RAG作为"知识大脑",MCP作为"行动系统"。技术选型应基于场景需

2025-11-23 18:00:00 2500

TrendRadar是一个用于从国内招投标网站获取软件类项目招标信息的工具,它可以定期抓取指定网站的招标信息,并生成结构化的报告

## 1. 项目概述 TrendRadar是一个用于从国内招投标网站获取软件类项目招标信息的工具,它可以定期抓取指定网站的招标信息,并生成结构化的报告。 ## 2. 主要功能 - 多平台支持 :支持从多个国内招投标网站获取数据 - 软件类项目过滤 :专注于获取软件类项目的招标信息 - 多种报告格式 :生成txt和html格式的报告 - 灵活配置 :支持配置监控平台、关键词、请求间隔等 - 代理支持 :可以配置代理服务器 - 通知功能 :支持多种通知渠道(需配置) - 增量更新 :支持增量模式,只关注新增的招标信息 ## 3. 支持的招投标网站 - 中国XX采购网 - 中国XX公共服务平台 - 中国XX招标网 - 千里马XX网 等等,可自行在配置文件中配置

2025-12-03

软件项目CMMI标准概要设计模板

概要设计的模板,基本每块内容都有说明。具体请详细看下。

2009-04-14

CMMI3详细设计模板

本文档是CMMI3标准的详细设计文档模板,值得收藏!

2009-04-28

IT图标素材库帮你快速编写PPT

如何成为PPT高手,不是要学习PPT的各种技术,而是需要有各种PPT模板图标等如何成为PPT高手,不是要学习PPT的各种技术,而是需要有各种PPT模板图标等

2018-11-12

Excel培训初级教程

Excel基础教学材料,包括函数使用,透视表制作,基础单元应用,适合办公室文员。教你快速熟悉常用excel操作。

2018-11-12

PPT素材库--目录、人物、图表、封面、图案、关系集

PPT素材库--目录、人物、图表、封面、图案、关系集等,丰富的素材是你PPT美化的第一要务

2018-11-12

Oracle知识整理.doc

对Oracle中的对象进行描述说明,并附上实际例子供参考!

2012-11-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除