自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 弯道超车,你也能做出deepseek这样伟大的大模型

DeepSeek在此背景下实现突围,其技术路径折射出中国AI团队在资源约束下的创新智慧——它既非对开源模型的简单微调,也非完全另起炉灶的豪赌,而是一场精密的"技术嫁接手术"。• 抛弃绝对奖励值,改为计算相对优势得分矩阵(RAS Matrix): $$ RAS_{i,j} = \frac{r_i - r_j}{1 + \sigma(\mathbf{h}_i^T\mathbf{h}_j)} $$ 其中r_i为样本i的奖励,\mathbf{h}为隐层状态向量。

2025-02-12 17:06:30 966

原创 关于人工智能与大模型的技术介绍

其实给实际的大语言模型输入的不是文字,而是通常叫Embedding的东西,文字必须转换成高维度的词向量(Embedding)+位置向量,大语言模型才能接受,大语言模型输出的也是矩阵向量或向量集。人工智能技术革命,以势不可挡的态势,一次次惊爆人们心灵,刷新人们的认知与见识,同时也引起人们的恐惧与担忧,今天我们在这里,探索这个引领科技前沿的话题,在接下来的时间里,我们将一起走过人工智能的发展历程,深入了解其核心技术,并探讨它如何逐步向通用人工智能(AGI)迈进。这就像是从单核处理器升级到了多核处理器。

2024-10-08 13:51:45 1391

原创 建设专业化运维服务团队必要性

信息系统的生命周期涵盖:设计、开发、测试、部署上线、运行维护。其中,运行维护阶段是信息系统生命周期中的关键环节,其执行效果直接影响系统是否能达到预期的运行目标。为了实现这个目标,我们必须建立一个以业务服务为导向的专业化运维服务团队,为行业提供高效、优质的运维服务,确保系统的稳定运行和用户体验的优化,最终为行业的高质量发展提供信息化支持。

2023-12-24 15:12:02 1797

原创 精准运维的利器:风险控制模型

导读:前期在《承载运维成功之梦:精准运维》一文中阐述了精准运维的原理、方法和实例。所谓精准运维,就是通过一系列方法掌握服务对象所使用信息系统的特性及其所服务企业的业务特性,通过掌控信息系统运行风险、运行特点、资源调配情况和业务部门反馈的意见来优化信息系统,从而精准的预测服务要求并开展服务计划,最终实现信息系统与业务心跳同步。精准运维让运维服务的价值更得以突显,使运维服务过程更重视用户体验,使运

2023-12-15 10:02:13 1418 1

原创 OpenClaw Skills 开发指南

建议 1-2 句话。当用户消息包含这些关键词时,Agent 会更倾向于使用这个 Skill。priority: 100 # 可选,优先级(越高越优先匹配)├── assets/ # 静态资源目录(可选)Skill 内容可以用任意语言编写,Agent 会根据用户语言自动适配。├── scripts/ # 辅助脚本(可选)triggers: # 可选,触发关键词。技能的名称,用于内部标识。当用户询问某地的天气时,使用此技能进行查询。

2026-03-12 21:14:56 470 1

原创 OpenClaw 架构与设计思路深度分析

它的核心设计理念是:让 AI Agent 生活在你日常使用的通讯工具中(WhatsApp、Telegram、Discord、Slack 等),通过消息通道与用户交互,同时能够代替用户执行真实世界中的各种任务。的设计,是一个重要的架构理念:在生产环境中,你不会直接把 LLM API 暴露给用户输入,而是在中间放置一个受控的编排层,处理路由、队列和状态管理。这是因为:如果同一会话的两个消息同时运行,它们可能产生冲突的工具输出,导致状态损坏。模型只能看到你放进上下文窗口的东西——上下文的质量直接决定输出的质量。

2026-03-12 21:11:18 1067

原创 OpenClaw 架构与设计思路分析

理念体现解耦消息通信、接口层、AI执行彻底分离隔离三层隔离,上下文不污染可扩展Channels + Providers 插拔式设计可组合多 Agent 协作模式灵活可选自托管完全本地运行,数据自己掌控自然语言编程Skills 用 Markdown 定义。

2026-03-11 17:04:12 553 2

原创 【无标题】AI Agent崛起:云运维的终结还是新生?

如果说传统的自动化脚本是运维的“肌肉”,那么AI Agent就是运维的“大脑”。什么是AI Agent?简单来说,它是一种能够感知环境、制定计划、执行动作并从结果中学习的人工智能系统。与简单的规则引擎不同,Agent具备推理能力和自主决策能力。在云运维场景中,一个成熟的AI Agent可以:主动监控:持续分析海量日志和指标,提前预判潜在故障智能诊断:当故障发生时,自动定位根因,而非仅展示告警自动修复:根据预设策略或自主学习,执行修复操作持续优化:根据负载变化,自动调整资源配置。

2026-03-01 07:32:29 549

原创 破译 Unsloth 微调大模型的秘密:从 Triton 内核到量化 LoRA 的全链路加速

如果把“大模型微调”看成一条以显存为代价换速度的流水线,那么 Unsloth 的秘诀,就是用系统化的“读一次、算尽可能多”的原则,重写这条流水线的每一个瓶颈环节。它没有只靠某个单点黑科技,而是把 Triton 自定义内核、LoRA 自定义自动微分、量化优先的内存工程、注意力路径融合、以及面向生态的 API 设计,一次性打包成了一套可复用的工程体系。这篇文章拆解 Unsloth 的核心技术路径与性能来源,帮助你在实践中“用最少的显存、跑最快的微调”。微调的核心路径常常被 LoRA 的前后处理与梯度构图拉慢。

2025-11-05 16:17:48 764

原创 大模型微调的原理与应用:从“通才”到“专才”的蜕变

它们通过在万亿级别的 tokens 上进行预训练,汲取了海量的通用知识,展现出强大的语言理解和生成能力,成为了无所不能的“通才”。预训练模型已经学习到了一个非常平滑和通用的“语义空间”,微调的作用是在这个空间内,针对特定任务区域进行“局部重塑”和“精细雕刻”,让模型在该区域的表示更加精确和深刻。微调的目标不是让模型忘记之前学到的通用知识,而是引导它将其通用语言能力“适配”到新的任务或领域上,使其在特定任务上的表现显著提升,同时保留其基本的推理和泛化能力。这是最传统的方法,即在微调过程中更新模型的所有参数。

2025-10-29 14:06:54 380

原创 自建大模型推理引擎中 KV Cache 的有效设计

在大模型推理过程中,KV Cache(键值缓存)是优化推理性能的关键技术。它通过缓存注意力机制中的 Key 和 Value 矩阵,避免在生成每个 token 时重复计算之前所有 token 的注意力信息,从而大幅减少计算量。

2025-10-29 13:49:41 558

原创 面向中小企业的大模型推理引擎:技术架构与应用实践

随着人工智能技术的快速发展,大语言模型在企业级应用中的需求日益增长。然而,对于广大中小企业而言,高昂的云计算成本、数据安全顾虑以及技术门槛成为了应用大模型的主要障碍。本文介绍了一种专为中小企业设计的高性能大模型本地服务引擎,该引擎支持多种开源大模型,提供OpenAI兼容的API接口,帮助企业以低成本、高安全性的方式部署和使用大模型技术。

2025-10-28 17:06:09 1110

原创 意识的幻象与算法的反射:人工智能沦为“巴甫洛夫的狗”

我们创造的,是一面无比光洁的镜子,它反射的,是我们自身对于“智能”与“意识”的混淆与渴望。当我们真正理解了那缕照亮我们内心世界的神秘之光,我们才能真正明白,我们与我们所创造的、那些在数据铃声中不断优化的、精致的“巴甫洛夫的狗”之间,横亘着的,是怎样一道无法逾越的鸿沟。人类的知识,是经过意识之火淬炼的产物。然而,若我们剥去科幻的华服,冷静审视当下人工智能的运作核心,一个更为贴切,甚至有些令人警醒的比喻浮出水面:它并非初生的心智,而是一台空前复杂的“巴甫洛夫之狗”,在数据的铃声中,精炼着它的条件反射。

2025-10-01 08:47:28 431

原创 卡尔曼滤波在统计应用中的应用

卡尔曼滤波(Kalman Filter)是一种递归算法,最初由鲁道夫·卡尔曼于1960年提出,主要用于估计动态系统的状态,尤其在存在噪声干扰的观测数据中。尽管最初被广泛应用于导航、控制系统和信号处理领域,但卡尔曼滤波在统计学中的应用也日益广泛。它通过结合预测和观测信息,提供了一种高效的状态估计方法,成为现代统计分析中处理时间序列数据和动态系统建模的重要工具。

2025-09-30 15:16:13 942

原创 在用户调研中应用卡尔曼滤波:用动态思维重构认知更新

在用户调研的漫长旅程中,我们永远无法抵达真理的终点,但可以通过卡尔曼滤波式的动态更新,让认知在"已有知识"与"新证据"之间不断进化。每一次调研都是认知系统的校准,每一次更新都是对用户真相的逼近。这种持续学习的智慧,正是现代用户体验研究最宝贵的资产。认知不是终点,而是不断演进的动态过程。在用户调研中,让我们用卡尔曼滤波的思维,构建永不满足、持续进化的认知系统。

2025-09-29 08:54:46 849

原创 如何将ISO20000的SLA与服务器响应时间有效结合?

等多个维度进行系统化设计。

2025-09-23 14:13:37 597

原创 网站营销策划与IT服务ISO20000的关系

通过这种协同,企业不仅能提升IT服务的可靠性,还能为网站营销策划提供更高效、安全的技术保障,最终实现业务增长与服务质量的双重提升。网站营销策划依赖于稳定的IT基础设施和系统支持,而ISO20000(IT服务管理体系)正是保障这些系统高效、可靠运行的关键标准。通过ISO20000认证的IT服务管理流程,可以优化企业内部的IT资源分配,从而间接提升营销策划的效率和效果。ISO20000不仅规范IT服务,还通过流程优化提升企业整体运营效率,从而为营销策划创造更有利的环境。

2025-09-23 14:11:06 675

原创 互联网运营中客户需求挖掘的一些方法

总之,运营中客户需求挖掘的准确与及时,决定运营的好坏。

2025-09-23 14:01:47 1551

原创 ISO 20000的服务管理框架与用户体验融合

其目标是通过标准化流程保障服务质量,而用户体验则是服务交付的关键衡量维度。基于ISO 20000挖掘用户需求、完善信息系统升级与服务提升,最终实现更好的用户体验,需要将。结合ISO 20000的流程管理与用户体验设计,确保系统升级既符合标准要求,又提升用户满意度。将用户体验指标纳入ISO 20000的绩效管理框架,确保服务改进可衡量。ISO 20000的核心是。是提升用户体验的核心机制。ISO 20000的。

2025-09-17 08:37:13 768 1

原创 在IT运营过程中如与ISO20000结合,创造更好地用户体验

在IT运营过程中,将与用户体验(UX)结合,能够通过标准化的流程、服务管理策略和持续改进机制,提升服务交付质量,从而更好地满足用户需求。

2025-09-17 08:30:05 1092

原创 ISO20000与IT运维和运营的关系

将运维与运营结合,确保 IT 服务既能稳定运行,又能支持业务目标。(如服务级别管理、变更管理、问题管理、事件管理等)来保障 IT 服务的。,其核心目标是通过标准化的流程和管理方法,确保 IT 服务的。ISO 20000 的流程设计主要围绕 IT 系统的。,最终实现 IT 服务的高质量交付和业务价值提升。,属于业务战略和资源管理层面的职责。ISO 20000 的核心是通过。(如系统维护、故障处理),也包含。以及与业务需求的对齐。,同时确保 IT 服务能够。,属于技术执行层面的职责。的技术执行流程,也涵盖。

2025-09-11 11:43:11 796 1

原创 vLLM与SGLang在自然语言处理领域的技术架构与性能对比研究

随着大语言模型在工业界和学术界的广泛应用,高效推理框架的选择成为自然语言处理领域的关键挑战。vLLM与SGLang作为当前最前沿的推理优化框架,分别通过创新的PagedAttention和RadixAttention机制展现了独特的技术优势。本文将系统对比两大框架的核心架构设计、实际推理性能、场景适配能力以及生态兼容性,为开发者提供科学的框架选型依据。首先我们将深入解析两种注意力优化机制的技术原理与实现差异。维度内存组织方式固定大小分页动态基数树结构访问复杂度O(1)固定寻址。

2025-07-14 11:16:19 1972

原创 当AI开始“思考“:大语言模型的文字认知三部曲

在大语言模型的“世界”里,文字也被拆解成这些向量,同时向量与向量之间的运算,就像主角尼奥在“矩阵”世界里对数据进行掌控一样——只不过这里的“数据”是无数经过训练后形成的权重参数和嵌入向量(Embeddings)。当我们观察现代大型语言模型的工作原理时,竟发现与这个虚构世界有着惊人的相似:人们正在用矩阵以及矩阵的运算给这些模型给这些模型赋能,模型本身就是个矩阵,所谓参数就是矩阵中的向量权重,那么人们是不是在给自己作掘墓人呢,我们就来演绎在由向量组成的多维空间里的认知革命。电影中墨菲斯的疑问"什么是真实?

2025-04-01 09:15:12 1209

原创 解读DeepSeek开源的flashMLA项目的意义

FlashMLA的核心理念在于通过底层硬件优化与开源共享,实现AI计算的高效与普惠。其技术突破不仅提升了国产AI生态的竞争力,更在全球范围内推动了开源文化的深化,为人工智能的普及和伦理化发展提供了重要范式。未来,随着更多企业加入开源生态,类似FlashMLA的创新或将重塑AI技术的全球格局。

2025-02-28 13:38:18 1004

原创 DevOps的文化观与工具

DevOps的核心文化是推动开发(Development)和运维或需求(Operations)团队之间的协作与沟通,以实现更快速、更可靠的软件交付。DevOps工具涵盖了多个方面,包括持续集成/持续交付(CI/CD)、版本控制、监控、配置管理、容器化等。DevOps文化的核心在于通过协作、自动化和持续改进,打破传统的组织壁垒,提升软件交付的速度和质量,同时增强团队的灵活性和响应能力。使用协作工具(如Slack、Microsoft Teams)和实践(如每日站会)来保持透明和开放的沟通。

2024-10-23 08:47:13 1022

原创 Scrum实战中遇到的问题与解决方法

与产品负责人合作,制定明确的优先级评估标准,按软件的性质分四类(现有应用的BUG、现有应用的扩展、新应用、基础应用)分别定义,如现有应用的BUG,应从影响业务的性质、面积等来定义优先级,并适度调高;然而,通过深入理解Scrum理念、持续改进流程、加强团队沟通与协作,团队可以有效地克服这些困难,提高项目的成功率。然而,在实际应用过程中,团队常常会遇到各种挑战和问题。产品待办事项(Product Backlog)中的任务优先级不明确,导致团队在Sprint中无法专注于最重要的任务,影响项目进度和质量。

2024-10-08 11:43:11 1495 2

原创 引入Scrum激发研发体系活力

确保团队成员具备必要的技能和协作能力,并保持团队的稳定性,以便于持续改进和高效运作,选择合适的团队成员至关重要。可以通过邀请外部专家授课、内部研讨会等形式,确保全员都能理解和接受这一新的工作方式,提升团队成员对Scrum的认知,并通过宣导活动,营造支持敏捷转型的企业氛围。Scrum的增量式交付和频繁的反馈循环,使得团队能够快速调整方向,响应市场变化和客户需求,提高产品的市场竞争力。Scrum通过明确的角色分工和固定的迭代周期,帮助团队更好地规划和管理工作,减少浪费和瓶颈,提高整体研发效率。

2024-09-27 12:02:19 1760 2

原创 敏捷开发与DevOps的有机结合

通过有效地结合敏捷开发与DevOps,企业不仅能够提升软件开发的效率和质量,还能够在激烈的市场竞争中保持敏捷应变的能力,确保IT运营和运维的顺畅运行。牢树企业文化,凝聚共同目标,发挥骨干尖刀排的作用,通过定期的沟通、共同的目标和相互的理解,促进团队之间的信任和合作。这不仅加快了交付速度,还提高了代码的质量和稳定性。DevOps也好,敏捷开发也罢,重点是在流程的控制,而企业的组织架构是根据自己的实际对流程的切割和分段管理,因此,做好每个节点的输入输出标准就很重要,每个节点质量效率有保证,交付才有保证。

2024-09-27 11:05:06 2665

原创 IT运营的灵魂是主动服务

主动服务能够通过持续数据预测分析与用户互动、快速迭代,及时同步用户的业务需求,甚至引导用户拓展和创新业务,可以让企业在市场上更具竞争力,快速响应市场变化和客户需求,实现更大价值与价值共赢。通过部署监控工具,IT团队可以随时了解系统的运行状况,用户使用习惯,用户喜好的功能与内容,各功能使用的高峰时段等。需求变化频繁问题:理解与掌握用户的业务与需求是企业成功的关键,特别是在定制化服务和产品开发方面,但往往用户的需求变化频繁,可能遇到在之前需求还未完全实现的情况下,用户已变化了新的需求。

2024-05-30 16:06:20 1854

原创 趋势—IT运维在向IT运营方向转变

近年来,运维人员面对不断涌现的新兴技术和架构转型的要求,如企业上云+中台+互联网、分布式、容器化、双中心双活,大数据、人工智能的应用等等。运维对象的数量激增:企业数字化转型导致应用系统数量增加,业务规模扩大带来系统细化和组件增多,微服务架构推广使得运维节点变得更加繁多。这些变化使得运维人员需要管理的服务器、容器等资源数量大幅增加,传统的手工运维方式难以应对规模化管理的需求,导致运维效率低下,管理成本上升。运维要求日益提高:随着用户对IT资源见识增多,对IT服务的要求也越来越高。

2024-05-27 10:19:06 1394

原创 需方管理运维运营服务的心得

在确保供应商提供的运营维护服务达到需方质量标准,并保障供应商具备相应的服务条件与能力方面,需方必须采纳一整套综合性的管理措施。需方应与供应商协作,制订详尽的服务级别协议(SLA),其中明确规定服务质量的期望标准,涵盖可用性、性能、响应时间、故障修复时间等关键性能指标(KPIs)。审计可以包括现场检查、服务报告分析等。复审则是在服务周期的某个阶段,如年度审查,对供应商的服务质量进行再评估,确保服务水平的持续性和改进。所有的流程、协议、评估报告、沟通记录和审计结果都应当有详细的文档记录,并进行归档管理。

2024-01-04 09:22:58 446

原创 承载IT运维的成功之梦:精准运维

“已是一个星期的晚上没睡好了,梦里全是啪啪的声音乱作一气,一串串红绿指示灯交替闪烁,我搞不清是梦还是在机房,只觉得一晚都在忙乎,醒来已是一身冷汗,这是自从前一段时间老板命令7*24小时确保新业务稳定运行,经一周苦战后,总周期性做梦,挥之不去”,这是一个有四年工作经验的运维骨干,也是我书的读者,与我交流的心里话,他快崩溃了,总是浮现老板幽幽的眼神,鄙夷的神情暗示他新系统上线就会崩,你们这帮吃干饭的。

2016-11-09 15:54:17 3759

转载 见龙在田!告诉你什么是真正的IT运维服务之道

苹果公司的乔布斯曾经希望改变世界,他通过iPhone这款产品实现了这一愿望。人工智能机器人AlphaGo在近期战胜了人类围棋手,这一消息也让全球震惊。的确,这个世界正处于万众创新的浪潮下,很多创新企业、创新理念、创新应用如雨后春笋般涌现出来。近年来,新产业、新业态、新产品层出不穷,机器人、新能源汽车、虚拟现实(VR)产品等技术也发展迅速,这些新技术的发展背后都是靠IT推动的。  IT是社会

2016-04-10 09:32:12 2822

原创 关于《IT运维之道》的扩充建议

《IT运维之道》出版半年多了,感谢广大书友的厚爱,不少书友还提了很多真知灼见,非常感谢,由于当时出书时,太赶,有些内容没说透,很有意犹未尽的感觉,而现在也很忙,很难有大段时间来整理完善,所以,有一想法,希望朋友们在原来基础上续写,写的稿子一经采纳,会再再版时引入,引入会注明作者,由于出书不赚钱,费用就没有了,请大家理解,这也算一种新众筹吧,有兴趣请加QQ:630559761 ,注明IT运维之道

2015-08-25 09:44:47 1182 1

原创 大数据时代与精准运维

随着科技的进步,我们正步入一个新的时代,新常态下,由重视数量到更注重质量,以创新做为推动力,互联网+、工业4.0、中国制造2025、以及大数据、云计算科技迸发出全新活力,以人为本智能时代就要到来,智能连接、智能服务、智能制造,“连接一切,充分感知”是这个时代的特征。因此,利用这个时代的特定服务,企业家们精准掌舵,站在风口上的人,注定将是大时代的弄潮人。什么是大数据

2015-05-20 14:49:41 6408

原创 说出您的看法,还想加什么

《IT运维之道》出版后,承蒙大家厚爱,第一版,货源告急,我想听听大家的意见或建议,我们争取在第二版(如果来得及的话)或第三版,根据大家的建议来增减一些内容,欢迎大家把宝贵建议抛出来,duang~

2015-03-07 18:17:53 2743

原创 等待已久,她终于来了!

国内首部,全面系统的阐述运维服务工作的书籍,《IT运维之道》正式开卖了,她是希望进入IT服务行业的朋友们的宝典,也是已入行的同事们快速提升的捷径,各大书店均有出售,网上是互动出版网、京东、亚马逊都有出售,喜欢者欢迎订阅,不感兴趣者飘过,欢迎朋友们帮助宣传

2015-03-04 09:16:53 745

原创 互联网模式的企业如何运维IT系统(二)

从上面例子可以看出互联网企业的运维特点:1.IT运维与IT运营不可分,是以创意或服务为导向,以运营为基础的运维;2.需要团队或复合型人才;3.强调资源有限原则下的优化与维护;4.强调准备与预案;5.强调快速诊断与解决问题;6.分清层级,强调必要时候的重点保障。互联网企业多数不像传统企业那样IT需求、软件开发、IT运维可以是三波人,互联网企业更像集团化作战

2015-02-26 22:16:27 1273

原创 互联网模式的企业如何运维IT系统(一)

难、难、难,不少人都摇头,确实因为实际困难太多,不确定因素太多,用户访问的高峰期不好预测,用户的访问偏好要事后才能分析,突发新闻或事件或帖子让峰值突然出现,企业的资源设备有限,各软硬件的疲劳期不好预测,每个业务系统都对维护有高要求,有时只能顾一部分,遇到突发事件,各领导电话和指示不断等等,确实是一件不好干的活,今年刚过去的春节抢红包这个热点顺利通过,应该为这些节假日坚守岗位的运维人致敬,他们到底是

2015-02-22 15:56:30 1917 2

原创 IT运维服务中的一些工作思路探索(整理)

文章发后,接受不少朋友的建议和意见,做了修改,现整理发给大家新版:一、 运维工作目标运维工作的目标是以行业用户满意度为导向,展开运维服务工作。企业需要发展,发展离不开我们的用户,用户满意度为导向能时刻提醒我们怎么做好运维服务工作,做好了运维服务工作,才能发展;要做好运维服务工作就得围绕用户满意度,推进“扎根”工作,“扎根”就是服务更加贴近用户实际,急用户所急,想用户所想,加强主动服务,

2015-01-15 10:00:47 13052 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除