- 博客(56)
- 收藏
- 关注
原创 AI Agent的定义
本文系统梳理了AI Agent的多种定义视角:1)技术实现角度(模型+框架+记忆);2)目标角度(自主完成任务);3)决策角度(动态调整流程);4)系统角度(跨平台运行);5)形式化角度(四模块架构)。文章还对比了Agent与Plugin/Skill/MCP的区别,指出Agent是综合调用这些组件的执行主体,并通过研发协作案例说明其实际应用。最后提出两个开放问题:动态工具组装和职责边界划分问题。
2026-04-14 17:17:40
433
原创 云计算技术栈
摘要:云计算技术栈涵盖基础设施、容器化、后端开发、数据库、网络与安全、DevOps、前端及AI服务。主要组件包括AWS/GCP/Azure云平台、Docker/Kubernetes容器技术、Python/Node.js后端框架、SQL/NoSQL数据库、API网关/IAM安全方案、CI/CD工具链、React/Vue前端框架及TensorFlow等AI服务。这一完整技术体系支持从底层架构到应用开发的云端全栈解决方案。
2025-09-09 20:52:11
454
原创 计算机系统方向可发会议/期刊参考时间
本文汇总了计算机领域20个顶级会议的关键信息,涵盖体系结构、并行计算、网络、系统软件等方向。A类会议包括PPoPP(24%接收率)、MICRO(硬件创新)、SC(25%接收率)等,普遍要求11-14页论文,强调系统实现、实验验证和交叉创新。B类会议如SOCC(23%接收率)、PODC(分布式理论)等更关注特定领域应用。网络顶会SIGCOMM(16%接收率)、MobiCom(16%)侧重协议创新和实验数据,系统顶会SOSP(17%)、OSDI(18%)要求全栈创新。投稿周期多在3-6个月,接收率普遍低于20%
2025-07-15 14:14:35
1222
原创 LoRA、S-LoRA与dLoRA:高效微调技术
LoRA、S-LoRA和dLoRA是三种优化大语言模型微调与推理的技术方案。LoRA通过低秩矩阵分解实现参数高效微调,将GPT-3更新参数减少10,000倍;S-LoRA聚焦多适配器批处理,支持并发服务;dLoRA则引入动态编排机制,在吞吐量上比vLLM提升57.9倍。三者在参数效率、批处理能力和动态优化方面各有侧重,其中dLoRA凭借请求-适配器协同迁移和负载均衡功能,最适合大规模生产环境。这些技术共同推动了高效LLM微调与服务的发展。
2025-07-10 10:52:55
665
原创 P99延迟:系统性能优化的关键指标
P99延迟是评估系统性能的关键指标,代表99%的请求响应时间低于该阈值,能有效识别尾部延迟问题。相比平均值和中位数,P99更能反映用户体验的边缘情况,是SLA的重要依据。优化P99延迟的四大策略包括:实施多级缓存、优化数据库查询、解决尾延迟问题以及使用现代可观测性工具。统计上需注意样本大小对P99估算精度的影响,大数据集可提供更可靠的指标。这些方法共同确保系统在高负载下仍能提供稳定的性能表现。
2025-06-22 22:03:17
1952
原创 Kubernetes中的Pause Container
Kubernetes中的Pause容器是Pod架构的核心组件,它在每个Pod中自动创建并负责管理共享命名空间。这个特殊容器不运行应用代码,而是为Pod内其他容器提供网络、IPC等命名空间共享功能。Pause容器与Pod生命周期绑定,确保网络完整性,并简化了容器间通信。通过隐藏网络配置细节、提供隔离性和高效资源利用,它使微服务架构中主容器与sidecar的协作更加流畅。尽管功能随Kubernetes版本演进有所变化,Pause容器仍是实现Pod多容器协调的关键基础设施。
2025-06-21 15:47:28
908
原创 K8s初始化容器与边车容器比对
Kubernetes中初始化容器(Init Containers)和边车容器(Sidecar Containers)是两类辅助容器,用途不同。初始化容器在主容器启动前运行,用于依赖检查、环境准备等一次性任务,且必须按顺序成功完成才会启动主容器。边车容器则与主容器并行运行,提供日志收集、代理等持续性辅助功能,共享Pod生命周期。选择时,预处理任务用初始化容器,持续辅助功能用边车容器。这两种容器模式增强了Kubernetes Pod的功能性和灵活性,是微服务架构中的重要设计模式。
2025-06-21 11:36:30
1121
原创 Docker重启流程解析
这是一个有状态的重启。容器的文件系统(包括你上次运行时写入的数据)和所有挂载卷都保持不变,只是进程被停止然后重新启动。内存中的状态会丢失。:是一个单一目的的命令。它的工作就是“启动一个已停止的容器”。如果你对一个正在运行的容器执行。本质上是一个方便用户的快捷命令,它捆绑了。:是一个复合命令,更智能。
2025-06-10 20:39:17
921
原创 12要素法:构建高效云原生应用
十二要素应用法是一套构建云原生应用的指导原则,强调可扩展性、可维护性和高效部署。核心内容包括:单一代码库管理;显式声明依赖;配置与代码分离;将后端服务视为可替换资源;严格区分构建、发布、运行阶段;以无状态进程运行;通过端口提供服务;进程模型实现扩展;快速启动与优雅关闭;保持环境一致性;将日志作为事件流处理;管理任务作为一次性进程。这些原则帮助开发团队构建适应云环境、易于维护和扩展的应用系统,实现开发与生产环境的高度一致。
2025-06-10 15:15:43
1211
原创 边缘卸载技术整理
卸载(Offloading)是一种将服务器、应用程序和相关数据移动到网络边缘的技术。这种技术可以增强个人设备或设备集合的计算需求,或者将云中处理设备请求的服务移至更接近数据源的位置。卸载技术是雾/边缘计算中的关键技术之一,通过合理的资源分配和任务分发,实现了计算资源的优化配置。减少延迟:将计算移至更接近用户的位置提高性能:分布式处理提高整体系统性能节省资源:优化资源利用和能耗增强体验:改善用户的服务质量和体验。
2025-06-05 14:57:12
608
原创 K8s工作流程与YAML实用指南
Kubernetes采用声明式管理方式,通过YAML文件定义期望状态。其核心流程包括:用户提交YAML→API Server处理→etcd存储→控制器监控→调度器分配→Kubelet执行→持续状态维护。标准YAML文件包含四大结构:API版本、资源类型、元数据和规格定义。示例展示了完整的Deployment配置,包括副本数量、容器镜像、资源限制和健康检查等参数。K8s会根据YAML描述自动创建和管理指定数量的Pod,并在出现故障时进行自愈,确保应用始终处于期望状态。
2025-05-30 15:54:13
824
原创 代理编程工具研究
近年来,随着大模型(Large Language Model, LLM)技术的突破,AI辅助编程逐渐从简单的补全工具演化为能理解项目全局、随时执行常规指令的“代理编程”(Agentic Coding)系统。本文基于当前行业发展趋势及最新研究成果,聚焦Claude Code的技术特点与实践经验,梳理代理编程工具所面临的挑战,并对相关工作进行综述与探讨。
2025-02-26 17:01:43
1204
原创 DeepEP简介
为了与 DeepSeek-V3 论文中提出的 group-limited gating 算法保持一致,DeepEP 提供了一套针对非对称域带宽 forwarding 进行优化的内核,例如从 NVLink 域到 RDMA 域的数据 forwarding。在生成式人工智能中,混合专家模型(MoE)是一种采用多个专业化的“专家”子模型处理不同任务的模型架构。专家并行(EP)是混合专家模型(MoE)采用的一种技术,通过让多个专家(专业化的子模型)并行处理任务的不同部分,将工作负载分布到这些专家之间。
2025-02-26 10:56:52
1176
原创 AI agent(以AutoGPT为例)和AI Workflow 区别
workflow能为明确定义的任务提供可预测性和一致性,而agent系统更适合需要灵活性和规模化模型驱动决策的场景
2025-02-24 16:06:24
1387
原创 翁丽莲 LLM Powered Autonomous Agents
大型语言模型(LLM)作为自主代理的核心控制器是一个创新概念。规划(包括任务分解和自我反思)记忆(包括短期和长期记忆)工具使用能力。这种系统通过LLM的推理能力,结合外部工具和记忆系统,可以完成复杂的认知任务。但当前这类系统仍面临上下文长度有限、长期规划困难、自然语言接口可靠性等挑战。
2025-02-24 11:01:48
1484
原创 科研场景AI工具全景透视
2024年全球Top100高校中,61%建立AI科研协作中心,平均研发效率提升37%DeepSeek-R1在乳腺癌早期筛查中实现92.3%准确率(需配合专业影像设备)建议:建立动态评估机制,每季度更新工具组合;重要成果需通过3种以上模型交叉验证。Llama量子版成功预测23种新型超导材料结构(3篇Nature子刊待发表)
2025-02-20 11:31:44
967
原创 DeepSeek 新注意力架构NSA
原生稀疏注意力的两个关键优势:(1)预训练的稀疏注意力模式能够高效捕捉对复杂数学推导至关重要的长距离逻辑依赖关系;(2)该架构的硬件对齐设计保持了足够的上下文密度,以支持不断增长的推理深度,而不会出现灾难性遗忘。在不同上下文长度下的一致优势证实了稀疏注意力在原生集成到训练流程中时,对于高级推理任务的可行性。
2025-02-19 10:14:00
1139
原创 pip warning ReadTimeoutError
错误如下表明在尝试从本地仓库()下载 TensorFlow 包时,连接在读取数据时超时了。以下是解决该问题的几种(治标不治本的)方法:(根本解决要分析机器网络带宽,链接问题,源的问题等)
2024-10-16 14:45:20
664
原创 MVP 最简可行产品
MVP(最小可行产品)是一种产品开发策略,其主要目的是用最少的时间和资源,开发一个包含最基本必要功能的产品。这样做的目的是能够以最小的成本进入市场,获取用户反馈,再根据反馈逐步优化产品。
2024-09-19 20:20:12
2039
原创 推理与训练,分布式训练
在人工智能领域,训练是指让机器学习模型做出准确推理的过程。训练可能涉及反复试错的过程,或者向模型展示期望输入和输出的示例,或者两者兼而有之。
2024-09-11 20:04:43
1541
原创 微服务中的Sidecar模式
sidecar是服务网络架构的产物。Sidecar,全称 Sidecar proxy,为在应用程序旁运行的单独的进程,它可以为应用程序添加许多功能,而无需在应用程序中添加额外的第三方组件,或修改应用程序的代码或配置。将应用程序的功能划分为单独的进程运行在同一个最小调度单元中(例如 Kubernetes 中的 Pod)可以被视为 sidecar 模式。在软件架构中, Sidecar 连接到父应用并且为其添加扩展或者增强功能。Sidecar 应用与主应用程序松散耦合。
2024-08-19 15:22:46
2999
1
原创 互联网技术之一 Markup
Markup (标记语言) 侧重于文本的结构和显示,适用于静态内容。Scheme Markup 在 Scheme 语言中是一种抽象化的数据或程序结构表示。
2024-08-18 11:29:05
1760
原创 6σ:数据驱动的管理方法
6σ是一种用于改善业务流程、减少缺陷和错误、极大限度减少差异、提高质量和效率的方法和工具。6σ的目标是达到近乎完美的质量水平,以进行业务转型,实现最佳客户满意度。
2024-08-02 12:22:03
1182
原创 End-to-End Argument 一种系统设计指南
End-to-End Argument 在选择平台层/下层中要提供的功能时,类似于“奥卡姆剃刀”,有些功能只能在应用层“完全且正确地实现”,而在平台层(中间节点或底层系统)实现这些功能则是不可能的。虽然End-to-End原则在很多情况下是有效的,但也不是绝对的。
2024-08-01 11:49:32
1127
原创 sloppy模型/sloppiness
sloppy模型或者sloppiness分析/算法:多参数的模型,其行为只取决于几个参数的严格组合,而参数的其它组合方式对模型预测来说并不重要。
2024-07-31 12:40:44
1680
原创 使用比特币进行匿名交易和交易追溯
题目:假设你是A国情报机关,需要给在J国执行任务的谍报人员提供活动经费,请问使用比特币如何操作才能躲过J国反谍机构的追查?J国反谍机构如何才能查出你的谍报人员?分别给出你的解决方案和J国反谍机构的解决方案。比特币交易本质上是公开的,每一笔交易都在区块链上公开记录,但交易者的身份是通过他们的公钥匿名的。然而,一旦一个公钥被关联到一个真实身份,那么与那个公钥相关的所有交易都可以被追踪。
2023-12-08 21:44:12
3643
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅