自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1367)
  • 收藏
  • 关注

原创 所有人都在讨论的“DeepSeek”究竟是啥,我们应该如何正确使用(建议收藏)

最近一夜爆火的DeepSeek,中文名“深度求索”,引起了全网的激烈讨论,热度居高不下。

2025-02-05 17:07:34 31282

原创 Deepseek v3开源,本地仅700G可轻松运行!

根据多个基准测试,DeepSeek v3 在代码方面甚至优于 Claude Sonnet 3.5那么671B的DeepSeek V3如何本地运行尼,由于DeepSeek的框架原生采用 FP8 训练,因此仅提供 FP8 权重,预估仅700GB+显存便可轻松运行。当然也可以转换到BF16,在半精度下,需1400GB+量化到int4时需要300GB+半精度 236B的DeepSeek V2,占用 490G 显存,需要 7张 80G A100。

2024-12-28 10:35:53 13747

原创 RAGFlow安装教程 | 带你一步步搭建RAGFlow【干货分享】

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-11-12 10:32:53 22943 3

原创 一文彻底搞懂深度学习:注意力机制(Attention Mechanism)

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-11-07 11:41:45 33606 3

原创 一文彻底搞懂多模态:模态表示、多模态融合、跨模态对齐

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-31 20:28:08 72564 3

原创 万字长文,带你搞懂什么是BERT模型(非常详细)看这一篇就够了!

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-25 10:20:54 60833 1

原创 手把手教你Ollama 安装部署教程,一键搭建本地大模型,不挑环境、不挑配置!

macOS:Linux:Windows:AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

2024-10-22 10:22:54 81320

原创 AI大模型 | OpenAI o1(最强推理模型)看这一篇就够了!

我们即将推出OpenAI o1,这是一种经过强化学习训练的新型大型语言模型,用于执行复杂的推理。o1在回答之前会进行思考——它可以在回应用户之前生成一个长长的内部思路链。-- Open AI 官方定义强化学习训练:o1模型的核心在于其采用了。

2024-09-20 11:07:22 15415

原创 大模型入门到进阶:什么是 RAG?为什么需要 RAG?RAG 的流程

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频,免费分享!

2024-08-14 09:49:08 38022 1

原创 一文了解什么是 RAG?为什么需要 RAG?RAG 的流程!

本文从大模型的局限性切入,探讨了检索增强生成架构的核心机制及其带来的好处。RAG 通过结合检索和生成能力,能从外部知识库搜索相关信息,生成更准确的回应,有效克服了大模型在知识更新上的短板。AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

2024-08-01 20:54:35 11295

原创 AI开眼了!多模态大模型架构全解析,从LLaVA到Qwen3-VL,小白也能秒懂的硬核指南

多模态大模型(MLLM)通过"三位一体"架构实现AI对物理世界的感知。LLaVA系列采用"大道至简"哲学,通过AnyRes技术处理高分辨率图像;Qwen3-VL则采用"深度融合"思想,利用DeepStack技术实现多层次信息注入。两种架构殊途同归,共同推动MLLM从简单感知向复杂推理与执行演进,未来将实现真正的多模态统一。

2025-12-11 15:39:57 260

原创 震惊!硅谷开出200万年薪的Agent架构师,原来都在偷偷用这3个方法

摘要 AI实践者许长鹏提出构建高效Agent的三个关键方法:1)设计结构化思考流程,通过规划、思维链等方法建立"逻辑脚手架";2)开发记忆压缩机制,利用反思和总结实现高效信息处理;3)整合工具系统,让Agent具备与现实世界交互的能力。他强调Agent架构本质是"以时间换效果",通过控制论和信息论原理建立闭环系统,逐步消除不确定性。性能优化方面,建议采用架构剪枝、并行执行和混合模型策略。这些方法共同解决了大模型在复杂任务中的注意力局限和推理脆弱性问题,使AI系统能够可

2025-12-11 15:30:24 545

原创 AI Agent技术大爆发!大模型编程开发实战指南,小白变大神只需这一篇

2025年成"AI Agent元年",市场规模186亿元,增长220%。市场从技术比拼转向生态实效博弈,MCP成全球标准。巨头推"全家桶"战略,垂直领域深耕行业Know-how。Agent Infra成新赛道,但大模型快速迭代挑战Agent技术栈。市场认知分化,乐观者视其为SaaS替代者,质疑者关注落地挑战。

2025-12-11 15:28:27 297

原创 大模型量化黑科技:模型缩小70%性能不降!小白也能轻松上手,AI平民化时代来了!

量化技术通过降低模型参数精度(如从FP32到INT8/INT4),在几乎不降低性能的前提下,大幅减少大语言模型的内存占用和计算需求。文章详细介绍了训练后量化(PTQ)和量化感知训练(QAT)两种方法,以及缩放因子、零点、对称/非对称量化等关键技术,还探讨了GPTQ、AWQ等高级量化技术和KV缓存量化方法。通过量化,大模型可在手机、笔记本等资源受限设备上高效运行,实现端侧AI、高性价比云部署和长上下文处理等应用场景。

2025-12-11 15:27:38 637

原创 腾讯用“LLM+GNN“双剑合璧,广告推荐GMV暴涨2.8%!小白也能学会的冷启动解决方案

腾讯广告技术团队创新融合LLM与GNN,采用"LLM解语义、GNN挖关系"协同机制,通过层级化语义ID Trie树构建营销对象关联图,有效解决新营销对象和用户冷启动问题。该方案在超10亿用户规模下验证,新营销对象占比超50%,实现GMV提升0.33%,新营销对象GMV增长2.8%,显著改善广告投放生态与用户体验。---

2025-12-11 15:22:13 240

原创 AI圈“新晋顶流“Agent:从“对话“到“行动“,小白也能掌握的大模型开发黑科技!手把手教你实现AI的“感知-决策-执行“闭环,错过再等十年!

Agent作为大模型的进阶形态,具备"感知-决策-执行"闭环能力,能自主理解目标、拆解步骤、调用工具并自我调整。文章解析了Agent的基本概念、实现思路、核心原理及运行机制,详细介绍了其通过观察、思考、行动、反馈的循环完成任务的过程,以及如何通过Function-call机制使用外部工具。Agent被视为通往通用人工智能的关键一步,实现了AI从单纯对话到实际行动的飞跃,重塑人机协作边界。

2025-12-11 15:14:20 789

原创 大模型首次响应慢如龟速?罪魁祸首竟是这两个指标!小白也能上手的GPU加速指南

本文介绍了大语言模型(LLM)的关键性能指标:首次生成Token时间(TTFT)与Token间延迟(ITL)。LLM工作分为预填充模式和解码模式,分别涉及大规模矩阵乘法和矩阵-向量乘法运算。GPU在加速LLM推理中发挥关键作用,预填充阶段依赖计算吞吐量,解码阶段可能受限于内存带宽。文章还讨论了如何在PowerVR GPU上实现高效的Llama.cpp推理,为边缘设备上的LLM部署提供解决方案。

2025-12-11 15:12:34 288

原创 【震惊】年薪200万的Agent架构师都在用的“慢思考“法,小白程序员也能轻松掌握!

Agent架构是当前AI紧缺能力,核心在于围绕大模型设计有效"认知流程"。文章提出三大方法:设计思考流程框架、打造记忆压缩算法、构建与现实连接的工具。通过控制论和信息论支持,结合架构优化、并行执行和模型特化,Agent正从"单兵"向"智能团队"进化,未来将实现认知调度、分层协作和即时代码生成等前沿能力。

2025-12-10 15:10:22 372

原创 震惊!给文档加“小抄“后,RAG系统直接起飞,命中率狂飙到92%!企业知识库必看技术

文章介绍了一种改进的RAG系统,通过让LLM先为文档生成摘要和标签,再使用混合向量进行检索,而非直接使用原文。采用三套并行分块策略、LLM自动生成三类元数据、三通道向量融合和Cross-Encoder重排,将Top-10命中率从73%提升到92%,同时降低检索延迟12%。实验证明Recursive+TF-IDF加权方法效果最佳,为企业知识库提供了更高效准确的检索方案。

2025-12-10 15:09:40 550

原创 RAG技术“灵魂拷问“:你真的懂检索增强生成吗?从本质到工程实践的全方位解析

本文深度解析RAG(检索增强生成)技术全链路,从检索、增强、生成三大核心环节展开。详细介绍了文档解析、Chunk切分、向量化检索、Query重写、上下文增强及生成控制等关键环节的工程实践,并提供了系统架构设计与性能优化建议。文章强调高质量数据预处理、语义化知识构建和精准检索策略是构建工业级RAG系统的基石,为开发者提供了从理论到实践的完整指南。

2025-12-10 15:08:27 335

原创 姚期智院士揭秘:中国AI已跻身第一方阵,大模型+AGI将彻底改变编程开发!

近日,由国家高新区人工智能产业协同创新网络、中央广播电视总台《赢在AI+》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院、赛迪研究院人工智能研究中心、中关村发展集团等联合主办的2025人工智能+大会在北京中关村国际创新中心&中关村国家自主创新示范区会议中心举行。图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长、清华大学人工智能学院院长姚期智发表演讲。非常高兴有机会能够和大家在这儿见面。我今天想和大家谈谈人工智能的未来发展。

2025-12-10 15:04:25 792

原创 告别AI“一本正经地胡说八道“!RAG技术详解,让大模型更靠谱

RAG(检索增强生成)技术通过检索外部知识库增强大模型回答能力,有效解决LLM的幻觉问题、时效性和数据安全。文章详解RAG的版面分析、知识库构建、大模型微调等核心模块,对比RAG与传统LLM和SFT的优缺点,并介绍多个RAG开源项目实战应用,帮助开发者构建更准确、可控的AI应用。

2025-12-10 15:02:42 401

原创 【技术突破】AutoGLM开源!手机Agent技术大爆发,小白也能30分钟部署本地AI助手,隐私安全双重保障!

智谱开源手机Agent项目AutoGLM,提供三种部署模式解决手机端算力不足与隐私保护问题。作为豆包被封后的重要开源事件,AutoGLM预计将引发手机Agent领域的技术变革,如同Stable Diffusion和LLaMA的开源一样,让技术种子播撒出去,为开发者提供打造专属AI助手的机会,标志着AI助手技术进入新阶段。

2025-12-10 14:53:16 694

原创 AI开发新趋势:编程用量超50%,中国开源模型杀疯了!

该报告基于100万亿Token使用数据分析AI发展趋势,发现:开源模型与闭源模型从"平替"变为互补关系,预计年底占比达1/3;中国开源模型流量份额从1.2%激增至30%;AI从"语言生成系统"转变为"推理执行系统";编程和角色扮演成为主要使用方式,编程用量占比超50%;用户留存呈现"水晶鞋效应",能解决特定痛点的模型可锁定高粘性用户;模型价格下降对使用量影响有限。

2025-12-09 10:57:05 1630

原创 【AI开发避坑指南】告别“一个模型打天下“!《State of AI》报告:2024年大模型开发必须知道的精细化运营策略

《State of AI》报告揭示AI市场已进入"精细化运营"阶段。编程成为大模型最快速增长的应用领域,用户更关注"完成任务的有效成本"而非单纯Token价格。AI正从"内容生成器"向"逻辑处理器"迁移,智能推理Agent成为标准。未来趋势是多模型组合策略:按任务重要性和实时性做多层路由,用业务场景定义能力边界,而非盲目追求最强单一模型。真正的竞争力在于构建稳定、成本可控、体验流畅的模型组合与工作流。

2025-12-09 10:55:35 442

原创 【技术干货】多模态大模型两大流派对决:LLaVA的AnyRes vs Qwen3-VL的DeepStack,看完你就明白AI如何“看懂“世界!

本文详细解析了多模态大模型的"三位一体"架构(视觉编码器、大语言模型和连接器),对比了LLaVA和Qwen3-VL两条技术路线。LLaVA采用"大道至简"理念,通过AnyRes技术处理高分辨率图像;Qwen3-VL则采用"深度融合"思想,利用DeepStack技术实现视觉信息的多层次注入。两种路线虽路径不同,但都推动了多模态大模型的发展,未来将向更统一的"世界模型"演进。

2025-12-09 10:54:21 815

原创 AI Agent与Workflow终极对决:大模型架构选择指南,小白程序员必看,这个选择决定了你的项目生死!

本文深入对比AI Agent与Workflow架构差异:Agent灵活但稳定性差、成本高,而Workflow稳定但缺乏灵活性。作者认为应根据业务需求混合使用——核心业务用Workflow保底,非核心业务可用Agent。Agent还能动态扩展工具,形成"模型→工具工厂→新工具集"闭环。最终强调:没有绝对优劣,关键是根据业务特点划清边界,才能让AI项目既长久又高效。

2025-12-09 10:53:33 776

原创 这个AI Agent让客服效率翻3倍,程序员的“智能客服“天花板来了!大模型+多系统集成实战,小白也能快速上手!

AI Agent客服系统通过"感知-决策-执行"闭环能力,实现从"被动应答"到"主动服务"的质变。借助自然语言理解和强化学习技术,它能整合多系统数据,主动解决问题。实际应用显示,客服响应时间从47秒降至8秒,问题解决率从53%提升至89%,人力成本降低40%。中小商家可通过模块化SaaS方案快速部署,实现人机协同的智能客服新模式。

2025-12-09 10:51:50 781

原创 大模型杀入蛋白质组学!小白程序员也能搞科研,代码一键生成生物学假设!

大语言模型正广泛应用于质谱蛋白组学四大方向:功能注释与本体构建、多组学整合与疾病机制推理、蛋白质功能问答与结构解释、以及自动化流程辅助。这些AI应用显著提升数据分析效率,从辅助分析到自动化科研流程,展现LLM在生物医学领域的广阔应用前景。

2025-12-09 10:50:14 539

原创 【震惊】手机一举一动都被“监视“?PATN框架让你的数据“隐身“,代码已开源!小白程序员也能秒会的AI隐私黑科技!

PATN是由西安交通大学与东京科学大学提出的移动传感器隐私保护框架,基于对抗攻击思想,通过微小扰动实现隐私保护同时不影响数据语义和时序结构。该框架解决了实时扰动生成和历史感知top-k优化两大技术难题,利用历史数据预测未来扰动,实现零延迟隐私保护。实验表明,PATN能有效抑制敏感属性推断,同时保持数据在下游任务中的可用性,代码已开源。---

2025-12-09 10:47:59 868

原创 大模型“翻车“救星!EAG-RAG技术全面解析,小白程序员也能构建专业级AI问答系统

EAG-RAG是传统RAG技术的进阶版本,通过构建闭环、自优化的端到端工作流程,解决了大模型知识时效性、幻觉问题和私有数据访问难题。该技术采用深度知识工程、双重LLM智能体优化、混合检索策略和闭环评估机制,将LLM智能推理能力部署到查询优化、内容富集、答案校验等关键节点,显著提升了企业级知识问答系统的准确性、可维护性和知识更新能力,实现无需频繁人工干预的持续自我改进。

2025-12-09 10:47:18 646

原创 AI程序员必看!RAG技术全攻略,让大模型不再“胡说八道“,小白也能秒变大神!

RAG技术解决大模型幻觉、时效性和数据安全问题。本文详解7大核心模块:版面分析、知识库构建、大模型微调、知识问答等,提供完整实现方法和优化策略。推荐RAGFlow、QAnything等开源项目,帮助开发者快速搭建应用,提升大模型回答准确性和可靠性。

2025-12-09 10:45:51 886

原创 大模型≠AI智能体!企业AI落地避坑指南,小白程序员也能看懂的架构决策矩阵!

文章澄清企业AI落地的关键概念:大模型不等于AI智能体,个人AI不等于企业AI,工作流不等于AI智能体。企业落地AI需构建统一架构,评估数据准备度、业务场景适配度和技术架构准备度三个维度,采用分阶段落地策略。企业AI落地是系统性工程,不是简单接入模型,而是涉及完整技术架构和选型。

2025-12-09 10:45:02 721

原创 从RAG到DeepResearch:AI搜索技术的三重进化,小白也能掌握的LLM高级玩法

文章介绍了大语言模型中"搜索"技术的三个发展阶段:传统RAG(检索增强生成)实现一次性检索;DeepSearch实现多步骤搜索和边搜索边推理;DeepResearch能根据用户研究问题制定计划并进行海量资源搜索,输出结构化研究报告。文章详细解析了各技术的工作原理、区别及应用场景,强调了DeepResearch作为研究工作者的助手价值,可帮助生成研究计划、撰写报告和整理文献综述。

2025-12-08 14:29:52 506

原创 【爆肝整理】法律大模型开发全攻略:AI程序员的跨界实战指南

本文系统综述了大模型在法律人工智能领域的应用,包括16个法律专用大模型系列和47种面向法律任务的框架,汇总了15个评测基准和29个数据集。文章分析了法律大模型的训练方法、评估指标及各类法律任务(如信息抽取、判决预测、法律问答等)的应用框架,并指出当前面临的数据集构建、可解释性、多模态等挑战,展望了未来发展方向,为法律AI开发者提供全面指引。

2025-12-08 14:28:27 489

原创 大模型开发:告别“卡顿焦虑“!PD分离技术让你的LLM服务性能提升10倍

文章详解大型语言模型推理中的Prefill-Decode分离技术,将计算密集型Prefill和内存带宽密集型Decode阶段部署到不同GPU集群。通过消除性能干扰和实现独立扩展,该技术显著提升资源利用率与系统性能,已成为业界主流架构,并介绍了多种实现方案与产业实践案例。

2025-12-08 14:25:51 812

原创 「代码已开源」腾讯WeKnora v0.2.0全面解析:ReACT Agent+Neo4j,小白也能玩转大模型RAG

腾讯WeKnora开源RAG项目v0.2.0迎来重大更新,新增知识库管理、ReACT Agent模式、Neo4j知识图谱支持及DuckDuckGo搜索引擎。文档解析功能优化,支持CSV、Excel等格式,并引入MarkItDown与MinerU专业解析器。尽管与主流RAG系统仍有差距,但已补齐多数现代RAG功能,展现出良好的发展潜力。

2025-12-08 14:25:07 812

原创 一文读懂大模型智能体(Agent):从理论到实践

要理解智能体的运作,我们必须先理解它所处的任务环境。在人工智能领域,通常使用PEAS模型来精确描述一个任务环境,即分析其:

2025-12-08 14:22:30 760

原创 程序员必看!大模型进化到4.0时代:不再是“一次性思考“,而是“边用边想“的智能体

文章介绍了AI大模型技术的发展历程,特别是最新的"交错思维链"(Interleaved Thinking)技术。这一技术使大模型能够像人类一样"边思考边行动",在思考和工具调用间建立动态反馈循环。DeepSeek-V3.2和MiniMax-M2等模型在此技术上取得突破,通过与生态系统的适配,使AI从"回答机器"向能独立执行任务的"智能体"转变,标志着大模型技术的重大革新。

2025-12-08 14:21:14 642

原创 AI正从“工具”变身“智能伙伴”!企业级Agent架构全拆解

过去一年,如果你持续关注大模型和AI落地,你会发现一个明显的变化:很多团队开始不再满足于“一个对话框 + 一个大模型 API”的简单形态,而是尝试把 AI 变成可以自主规划、主动帮忙、长时间协作的“智能伙伴”。

2025-12-08 14:20:16 653

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除