自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2349)
  • 收藏
  • 关注

原创 揭秘大模型概念与应用:探讨其在不同场景下的落地实践

大模型是什么?大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。这些模型需要大量的计算资源和存储空间来训练和存储,并且往往需要进行分布式计算和特殊的硬件加速技术。大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。

2024-08-28 11:26:39 1525 1

原创 医疗与大模型:重塑未来医疗生态的营销之道

医疗与大模型的结合正成为行业发展的重要趋势。面对这一机遇和挑战并存的局面,我们应积极拥抱变革、勇于创新实践。通过精准定位、打造案例、拓展合作和创新模式等多种手段相结合的方式,共同推动医疗大模型在行业的广泛应用和普及发展。那么,我们该如何学习大模型?作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2024-06-13 13:38:20 2856 1

原创 HippoRAG 2.0重磅升级!三大黑科技解决RAG上下文丢失,多跳推理性能暴涨12.5%

HippoRAG 2.0针对1.0版本的上下文丢失问题进行了三大关键升级:1)采用稠密-稀疏集成的节点设计,同时保留核心概念和完整上下文;2)引入深度上下文化机制,通过三种查询链接方式实现从实体匹配到意图理解的跨越;3)新增识别记忆机制,结合嵌入模型和LLM过滤噪声,精准定位种子节点。系统通过离线索引构建结构化知识图谱,在线检索时结合PPR算法实现高效多跳推理,使LLM具备类人记忆能力,显著提升了多跳问答性能(召回率平均提升12.5%)。

2026-03-14 16:58:41 91

原创 GitHub 71k Star!微软官方开源,6个LLM零基础入门神级教程合集(附640份报告)

推荐GitHub 71k Star的微软官方课程及6个优质LLM开源项目,涵盖从原理到部署的全流程。本文还整理了包含640份行业报告、书籍和视频的保姆级学习资料包,助力程序员零基础系统掌握大模型技术。

2026-03-14 16:57:46 318

原创 Anthropic逆袭!26Q1 ARR反超OpenAI,揭秘AI巨头的算力与商业终局

AI大模型行业进入Agent时代,Anthropic凭借Opus 4.5模型的Agentic Coding能力实现技术突破,26Q1收入增速超越OpenAI。三大巨头技术路线差异显著:OpenAI侧重2C场景,谷歌聚焦多模态生态,Anthropic专注2B编程领域。算力布局方面,企业均投入巨资构建基础设施。商业化路径上,Anthropic以API为核心,谷歌赋能传统业务,OpenAI采取2C+2B策略。随着模型能力提升,底层模型企业将占据优势,应用层企业面临挑战。行业影响深远,将重构广告、SaaS市场及劳动

2026-03-14 16:56:51 275

原创 AI模型调优避坑指南:从数据清洗到模型集成,手把手提升准确度与泛化能力

本文系统总结了提升AI模型准确度与泛化能力的核心技巧。涵盖数据工程(清洗、增强、伪标签)、训练优化(学习率、优化器、早停)、错误分析、知识蒸馏及模型集成五大模块。从基础数据处理到高级架构优化,提供了一套即学即用的实战调优手册,助你突破性能瓶颈。提升AI模型的准确度与泛化能力,是每位AI从业者的核心追求。这本质上是一个涵盖数据处理、训练优化与模型集成的系统性工程,**需进行层次化的策略设计与执行**。本文不探讨前沿理论,而是聚焦于经过大量实践验证、能直接带来提升的**核心技巧**,以“是什么、为什么、怎么

2026-03-14 16:56:01 198

原创 2026年最全人工智能学习路线:新手到大学生的完整指南,AI产品经理必备,一篇收藏就够

摘要:本文系统介绍了人工智能学习路线,分为入门、中级、进阶和高级四个阶段。入门阶段需掌握Python编程、数学基础和机器学习/深度学习基础;中级阶段需深入学习算法并实践项目;进阶阶段需学习自然语言处理、计算机视觉等前沿技术;高级阶段需钻研深度强化学习等尖端技术并进行创新研究。文章强调人工智能是未来技术趋势,建议开发者持续学习更新知识,并提供了3个月速成模型大师的"邪修路线"建议。全文配有丰富图示和具体学习要点,为AI初学者提供了清晰的学习路径指导。

2026-03-13 18:04:55 440

原创 AI人工智能基础小白学习路线:零基础入门指南

人工智能(AI)已经成为当今科技领域最热门的话题之一。从智能家居到自动驾驶汽车,从语音助手到医疗诊断系统,AI的应用无处不在。然而,对于许多初学者来说,AI可能是一个陌生且复杂的领域。如果你对AI充满兴趣,但又不知从何下手,那么这篇文章将为你提供一份清晰的AI基础学习路线,帮助你从零开始,逐步掌握人工智能的核心概念和技能。

2026-03-13 18:02:46 299

原创 RAG 评估实战指南:用 RAGAS + LangFuse 构建可量化的检索增强生成系统

本文介绍了如何利用RAGAS框架自动化评估RAG(检索增强生成)系统效果,并通过LangFuse实现评估过程的可观测性。RAGAS从检索质量和生成质量两个维度,通过四个核心指标进行评估:Faithfulness(生成答案对检索内容的忠实度)、Context Precision(检索文档的相关性及排序)、Context Recall(检索内容的完整性)以及Answer Relevancy(答案与问题的相关性)。文章详细解析了各指标的评估原理,如Faithfulness采用两阶段LLM调用验证事实声明,Cont

2026-03-13 18:01:35 264

原创 RAG、KAG 与CAG的一知半解

本文分析了三种大模型增强生成框架:检索增强生成(RAG)、知识增强生成(KAG)和缓存增强生成(CAG)。RAG通过实时检索外部数据减少幻觉,适用于动态场景但存在延迟;KAG利用知识图谱提升专业领域推理精度,但构建成本高;CAG预加载静态知识实现快速响应,适合固定内容场景。三者各具优势,未来趋势是混合应用。文末提供了大模型学习的进阶路径,从基础到微调部署四个阶段,并附有配套资源。

2026-03-13 18:00:10 288

原创 AI大模型风口来袭!30节课+500+论文,带你抢占未来话语权,高薪技能轻松掌握,非常详细的大模型教程

2023年大西洋彼岸的OpenAi公司,**首次向世界吹响「大模型主导未来世界变革」的号角。**AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,**这次我特意复盘和整理大模型学习脉络,开了30节大模型的课程**,包含**大模型理论、大模型论文带读以及大模型企业项目实战,还附赠500+大模型论文**

2026-03-12 15:38:21 554

原创 告别无效加班!AI智能助理让你效率翻倍,轻松躺赢职场!

每天忙得脚不沾地,却感觉什么都没干? 写报告、查资料、整理数据、回复邮件...这些重复性工作占据了打工人80%的时间。 是时候让AI帮你打工了。

2026-03-12 15:37:05 190

原创 AI Agent进化史:从死记硬背到自主学习,揭秘智能体背后的“踩坑”与突破!

文章回顾了AI Agent的发展历程,从早期的基于符号与逻辑的智能体(如MYCIN、SHRDLU、ELIZA),到马文·明斯基提出的心智社会理论,再到现代基于学习范式的智能体(如联结主义、强化学习、大规模预训练+大语言模型)。文章揭示了AI Agent为何从依赖预设规则演变为能够自主学习、自我改进的形态,强调了学习范式在其中的关键作用,以及大语言模型如何整合前人经验,创造出具备复杂认知能力的现代智能体。

2026-03-12 15:36:06 237

原创 从被动响应到主动规划:AI Agent 工程师指南——构建、实现和落地可控且高效的智能体

本文从工程实践角度系统阐述了如何设计、实现和落地一个可控可用的AI Agent系统。文章以大型语言模型(LLM)为核心,构建了面向工业级应用的AI Agent全栈设计框架,强调Agent从被动响应到主动规划执行的能力跃迁。内容涵盖软件范式演进、LLM到Agent的转变、Agent研发特点等基础知识,并重点介绍了提示词工程、规划、记忆、工具使用等关键技术组件。作者指出Agent研发需要从传统编码思维转向目标导向思维,通过架构设计让LLM成为具备持续进化能力的可靠协作者。文章为AI Agent的工程化落地提供了

2026-03-12 15:34:52 351

原创 Java程序员转行大模型开发:高薪风口,5步转型攻略_程序员转行AI大模型必备教程

本文为Java程序员提供了转向大模型开发的实用指南,系统介绍了从基础概念到实战落地的完整路径。重点包括:1)掌握机器学习基础与PyTorch等工具;2)发挥Java工程经验优势;3)提升数学与算法能力;4)参与项目实践积累经验。文章还详细分析了AI大模型时代涌现的7大高薪岗位(如AI工程师、模型架构师等),并提供了包含提示词工程、RAG、微调等核心技术的104G学习资源包。最后强调2025年将是Agent技术元年,建议程序员把握当前转型窗口期,通过系统学习实现职业跃迁。

2026-03-11 11:27:00 535

原创 5个概念彻底搞懂!Agent、LLM、RAG、Skills、MCP全解析

大模型应用开发核心概念解析:Agent、LLM、RAG、MCP、Skills的协同关系 摘要: 本文用办公助手类比解析大模型应用的五大核心组件:LLM作为思考大脑,RAG提供精准知识库,Skills实现具体功能,MCP规范执行流程,Agent统筹全局。通过电商客服和数据分析师等企业案例,展示了五者如何协同工作——LLM生成回答时,RAG补充实时知识,Skills执行数据库查询等操作,MCP确保流程规范,Agent最终整合输出。文章指出,理解"Agent统筹、LLM思考、RAG补知识、Skills执

2026-03-11 11:25:56 516

原创 AI元年!大模型算法5.2w月薪!2026校招AI人才趋势全解析,应届生必看!

今年是 AI 应用的元年,自 DeepSeek 的冲击后,全球的 AI 竞赛立即打响,从 Meta CEO 扎克伯格上亿美元争夺 AI 人才起,这股火势已经蔓延至即将到来的 2026 年人才校招,我们来一睹这份最新的校招 AI 人才有什么趋势。

2026-03-11 11:24:05 281

原创 从零到精通:AI大模型学习路线图,速成高薪技能!2026最新AI大模型学习路线

AI大模型应用开发工程师学习路径及职业前景摘要 本文系统梳理了成为AI大模型应用开发工程师的学习路径,包含数学基础(线性代数、微积分、概率统计)、编程技能(Python、数据结构算法)、机器学习/深度学习理论及实践(Kaggle竞赛、经典模型实现)、大模型应用(Transformer架构、预训练模型)等核心内容。同时介绍了该职业的核心职责:需求分析、技术选型、应用开发、测试优化及部署运维。当前市场对该岗位需求旺盛,月薪最高可达60k,凸显其在AI技术落地过程中的关键桥梁作用。文末提供了免费学习资源获取方式,

2026-03-10 11:01:33 1038

原创 大模型落地四步法:告别“大而全”,实现可复制、可审计、可推广!

摘要: 大模型落地面临的主要挑战是缺乏清晰路径,本文提出“四步法”方法论:1)选场景,聚焦高频、可验证的小场景;2)夯基础,确保数据可理解、可追踪;3)做原型,通过MVP明确模型角色与边界;4)上规模,形成可复制的SOP与模板。核心观点认为落地成功依赖业务结构化与流程化,而非单纯模型能力。同时,AI大模型应用开发工程师作为技术落地的关键角色,负责需求拆解、模型适配及产品化,其市场薪资可达60k/月,凸显技术-业务复合能力的重要性。

2026-03-10 11:00:29 236

原创 大模型医疗应用火爆!华西二院数字医生如何实现人机共智?深度解析!

摘要:DeepSeek V3/R1在医疗领域展现优势,华西二院探索大模型与医疗系统的深度结合。通过模型训练(预训练、监督微调、强化学习)和智能体开发(提示工程、工作流编排、RAG等)两大技术路径,实现"模型能力→业务落地"闭环。以数字医生项目为例,开发包括需求分析、测评基线、模型选择、多智能体架构设计等环节,最终实现预问诊、辅助诊断和电子病历生成等功能。未来趋势包括模型小型化、数据合成、自然语言编程、多智能体协同及人机共智模式,将重塑医疗智能化格局。(149字)

2026-03-10 10:58:23 379

原创 打造 LLM & Agent 全局认知地图,轻松构建AI大脑!

本文构建了一个LLM与Agent技术的结构化知识体系图,采用类人大脑模型进行组织。该体系包含八大层级:1)LLM核心层(架构/训练/推理);2)感知系统(多模态输入);3)记忆系统(短/长期记忆);4)推理系统(多种思维链方法);5)规划系统(任务分解等);6)行动系统(工具调用等);7)反馈与自进化;8)安全边界。最终形成完整Agent架构公式:Agent=LLM+Memory+Reasoning+Planning+Tools+Feedback+Safety。文章还介绍了AI大模型应用开发工程师的职责(需

2026-03-10 10:57:15 349

原创 2026最新AI产品经理转型必读:8本书助你成功入行_大模型产品经理书籍

AI时代产品经理进阶指南:8本必读书单与职业发展建议 文章为AI产品经理和开发者提供实用指南,推荐8本核心书籍,涵盖AI产品管理、ChatGPT应用、推荐系统、AI Agent等领域。重点介绍了AI大模型应用开发工程师的角色定位,包括需求分析、技术选型、应用开发等核心职责,并指出该岗位市场月薪最高可达6万元。文章强调这一职业作为AI技术落地桥梁的重要性,建议从业者通过系统学习提升技能,同时提供免费AI大模型学习资料领取方式。

2026-03-09 15:27:51 443

原创 RAGFlow深度解析:从基础理论到实际应用的全方位研究

本文采用苏格拉底提问法研究RAGFlow技术,围绕9大主题展开系统探讨:1)RAG基础理论(知识边界、检索增强本质等15个问题);2)深度文档理解(OCR、表格解析等18个问题);3)文本分块策略(语义分块、动态分块等16个问题);4)向量检索与嵌入(相似度计算、混合检索等18个问题);5)重排序优化(多路召回、实时重排等16个问题);6)知识图谱(实体抽取、多跳推理等16个问题);7)Agent工作流(工具调用、多Agent协作等18个问题);8)多模态RAG(图像检索、跨模态搜索等14个问题);9)企业

2026-03-09 15:26:50 330

原创 AI三大核心技术:大模型=新同事,向量=文字指纹,智能体=小机器人!

摘要: 本文以Java开发者熟悉的视角,拆解AI应用开发的三大核心技术: 大模型:类比为“博学但缺乏专精的新同事”,擅长模式识别但需结合领域知识(如RAG)提升实用性; 向量:将文本转化为“数学指纹”,通过向量数据库实现语义检索,突破传统关键词匹配的局限; 智能体:像“自动化小机器人”,能规划任务、调用工具(如API)并自主处理复杂流程。三者协同工作,例如在智能客服中,先通过向量检索相关文档,再由大模型生成回答,复杂问题则由智能体分步解决。技术架构分层清晰,涵盖基础设施、向量处理、模型推理及智能体决策层。

2026-03-09 15:25:43 331

原创 金三银四AI抢人!年薪百万岗位爆发,普通人如何抓住高薪逆袭机遇?

【AI岗位成春招"版本答案",百万年薪争夺战打响】2026年春招季,AI相关岗位需求呈现爆发式增长,单月同比增幅超11倍,大模型、算法、多模态等技术岗位成为大厂争抢焦点。字节跳动、百度等企业纷纷提前启动招聘,AI岗占比最高达90%,核心岗位年薪突破百万,实习生日薪可达2000元。数据显示,AI人才缺口将达400万,零基础者也可通过系统学习入场。AI大模型应用开发工程师作为技术落地的关键角色,月薪最高达6万,成为当前最具吸引力的职业选择之一。这场AI人才争夺战正为普通人创造前所未有的就业红

2026-03-09 15:24:55 376

原创 2026最新大模型产品经理学习路线:大模型产品经理进阶指南,从零基础到精通,解锁AI商业新机遇!

摘要:随着AI技术快速发展,大模型产品经理成为热门岗位。该岗位需要掌握计算机基础、AI/机器学习知识、大模型技术(分布式训练、模型优化等)、产品管理及商业分析能力,并通过实战项目积累经验。当前AI人才缺口达500万,相关岗位薪资涨幅超40%,但83%自学人员因缺乏系统路径而放弃。为帮助从业者快速成长,现提供全套AI大模型学习资源包,包含思维导图、书籍、视频教程等,助力抓住AI行业黄金机遇。(149字)

2026-03-08 18:04:40 534

原创 大模型推理框架大比拼:vLLM、SGLang、TensorRT-LLM,哪个才是你的最优解?

本文对比了三大主流大模型推理框架vLLM、SGLang和TensorRT-LLM的技术特点。vLLM通过PagedAttention和Continuous Batching技术显著提升显存利用率至95%,适合高并发企业应用;SGLang采用RadixAttention实现多轮对话KV缓存复用,吞吐量比vLLM高5倍,是Agent场景的理想选择;TensorRT-LLM通过预编译和极致量化实现最低延迟,但仅支持NVIDIA GPU。文章提供了选型决策表,建议企业服务根据响应速度、多轮对话或极低延迟需求分别选择

2026-03-08 18:03:26 393

原创 Qwen论文全解析:从初代到Qwen3,26篇技术报告深度盘点,揭秘开源模型迭代速度之最!

阿里通义千问(Qwen)系列模型在两年多时间内快速发展,发布了26篇技术报告,获得2905个HuggingFace点赞,成为开源领域迭代最快、覆盖模态最全的AI模型体系之一。该系列从基础语言模型Qwen演进到Qwen3.5,并扩展到多模态领域,包括视觉语言、音频、代码生成、图像生成等能力。Qwen展示了"系统性铺张"的竞争策略,通过密集产品线覆盖市场。最新成果包括Qwen3-ASR(52种语言语音识别)、Qwen3-TTS(3秒声音克隆)等,在多个领域达到开源SOTA水平。PaperSc

2026-03-08 18:02:35 504

原创 2026最新AI大模型学习路线:(非常详细)AI大模型入门,收藏这一篇就够了!ai学习路线

学习大模型需要打好数学与编程基础。数学方面需掌握线性代数(矩阵、向量等)、微积分(导数、积分)和概率统计(概率分布、贝叶斯定理),推荐Khan Academy和MIT的公开课。编程方面需熟练使用Python,并掌握数据结构(数组、链表等)和算法(排序、搜索等),可通过Codecademy和Coursera课程学习,配合LeetCode练习。扎实的基础知识是深入大模型领域的关键。

2026-03-06 20:36:40 540

原创 2026年AI发展核心卡点解析:数据治理如何赋能智能体?

国家数据局部署2026年重点工作提出,**强化数据赋能人工智能发展**,进一步落实高质量数据集建设行动计划,深入实施强基扩容、应用赋能、提质增效、管理服务、价值释放等6大专项行动。那么到底什么样的数据能够直接给到智能体应用,中间有哪些转换过程,为什么人工智能发展到现在,数据治理被认为是核心卡点。本文以法人数据为例,讲解从传统数据平台上存储的数据,经过怎样的转换,才可以让智能体准确的使用。

2026-03-06 20:35:08 336

原创 大模型评测内幕:数据集、测评维度与榜单猫腻全解析!

本文系统探讨了大语言模型的评测方法,指出当前评测体系包含MMLU、C-Eval等核心数据集,覆盖自然语言理解、知识推理等关键维度。文章揭示了厂商"刷榜"现象,建议应关注模型实际能力而非榜单排名。同时详细介绍了少样本/零样本测试方法及SOTA概念,强调评测应以应用效果为导向。作者认为,当前大模型评测存在过度优化指标的问题,需警惕为追求榜单排名导致模型能力失衡的风险。

2026-03-06 20:34:13 345

原创 大语言模型优化秘籍:RAG vs 微调,如何选对方案提升性能?

摘要:RAG(检索增强生成)和模型微调是优化大语言模型的两大主流方法。RAG通过连接外部知识库实时检索信息生成答案,适合知识更新频繁的场景,但依赖检索质量且实现复杂。模型微调则通过特定数据训练调整模型参数,适用于专业化任务,但成本高且知识静态。核心区别在于RAG动态获取外部信息,微调则优化模型内部参数。实际应用中,建议从简单方案开始,根据数据质量和需求灵活选择或组合两种方法。随着AI应用层需求激增,掌握RAG、微调和Agent开发等核心能力将成为技术人员的竞争优势。

2026-03-06 20:33:09 353

原创 2026年转型大模型产品经理的完整路线图,产品经理们现在就是你们转行大模型产品经理的最佳时机!

大模型产品经理转型指南:从基础认知到实践路径 本文系统梳理了AI产品经理转型大模型领域的关键要素。首先明确了大模型的基本特点和技术优势,指出其作为AI发展重要趋势的必然性。在转型准备方面,提出了五项核心能力要求:技术理解力、数据分析力、用户洞察力、产品设计力和团队协作力,并提供了详细的自我评估框架。针对知识储备不足的问题,推荐了从原理学习到应用实践的系统学习路径,包括经典论文、开源工具和在线平台资源。最后强调场景挖掘的重要性,建议通过行业分析、用户研究和竞品分析寻找大模型的最佳落地场景。全文为有意转型的AI

2026-03-05 17:25:51 473

原创 RAG实战揭秘:用Easysearch让大模型不再“一本正经胡说八道”,10幅漫画带你秒懂AI新引擎

文章摘要:本文介绍了RAG(检索增强生成)技术如何解决大模型在企业应用中的痛点。传统大模型存在知识盲区和幻觉问题,而RAG通过实时检索外部知识库,让大模型从"闭卷"变为"开卷"。文章详细解析了RAG的工作原理:离线阶段将知识向量化存储,在线阶段先检索相关文档再生成回答。相比微调,RAG成本更低、更新更快。推荐使用Easysearch作为混合检索底座,兼顾语义理解和精确匹配。RAG技术显著提升了大模型在企业场景中的实用性,是AI落地的重要基础设施。

2026-03-05 17:24:09 392

原创 RAG架构全解析:从标准到图检索,10种方法让你的AI更智能、更可靠!

本文系统解析了RAG(检索增强生成)架构的10种变体及其应用场景。从标准RAG的基础流程,到对话式RAG的上下文记忆、纠正式RAG的实时验证、自适应RAG的智能路由、自我反思RAG的批判性思维等进阶架构,文章详细阐述了各类RAG的工作原理和优劣势。特别介绍了融合式RAG的多角度检索和HyDE的反向检索思路,以及代理式RAG的复杂推理能力。最后提供了架构选择框架,帮助开发者根据响应速度、准确性、成本等需求选择最优方案,为构建高效AI系统提供实用指导。

2026-03-05 17:23:07 352

原创 大模型赋能数据治理:降本增效,开启AI与数据双向赋能螺旋上升时代!

摘要 大模型正在重塑数据治理模式,形成AI与数据的双向赋能循环。传统数据治理面临成本高、效率低、价值难显的困境,而大模型通过语言理解、代码转换等能力显著提升治理效率:数据开发提效40%,制度文档生成成本降低50%,并优化元数据管理等核心环节。同时,高质量治理数据又反哺AI模型,减少幻觉问题。尽管存在数据质量制约等挑战,但"AI+数据治理"已展现出实际价值,如某金融机构成本降低25%、审批流程提速一倍。未来3-5年将形成人机协同新范式,开启智能时代新篇章。(149字)

2026-03-05 17:21:38 393

原创 大模型面试实录:20家公司Offer与拒信背后,我悟出了这些职场真相!

摘要 作者分享了2023年大模型热潮期间面试国内23家科技公司的经历,包括智元机器人、面壁科技、阿里达摩院等知名企业。面试主要考察Transformer架构、大模型训练、分布式框架等核心技术,多数公司提供较高薪资待遇。通过面试发现:大模型领域竞争激烈,研究岗需兼顾工程能力,初创公司对综合能力要求更高。高频考点包括多头注意力机制、并行训练方法、模型评估等。作者建议在保持模型能力的同时加强底层技术学习,并指出RLHF是多模态研究的重要方向。整体来看,大模型岗位薪资高于同级别其他岗位,但市场前景尚不明朗。

2026-03-04 20:31:20 535

原创 保姆级教程:vLLM部署Qwen2-7B大模型,新手半小时轻松搞定,本地运行更香!

概要:AI应用如火如荼,本文用 vLLM 部署 Qwen2-7B,全程不用复杂配置,新手也能半小时搞定。既能本地私有化运行,保护数据隐私,又能享受媲美云端的推理速度,不管是做个人知识库,还是小团队的 AI 应用,都非常香!

2026-03-04 20:29:42 443

原创 AI工具大比拼:Coze、Dify、n8n、LangChain,哪个才是你的“AI神器”?

本文对比了四大AI工具Coze、Dify、n8n和LangChain,用通俗易懂的比喻帮助读者理解各工具的特点和适用场景。Coze适合零代码快速上线的用户;Dify适合需要开源和私有化部署的企业用户;n8n适合自动化工作流爱好者;LangChain适合专业程序员进行深度定制。文章还提供了工具组合使用的建议,帮助读者根据自身需求选择合适的AI工具。

2026-03-04 20:28:31 354

原创 VLLM本地部署大模型保姆级教程:从环境搭建到RAGFlow集成,数据安全又高效!

本文详细介绍了使用VLLM高性能大模型推理引擎在Ubuntu系统上进行本地部署的完整流程。内容涵盖硬件软件环境准备、安装依赖、下载模型、Docker容器化部署以及RAGFlow集成等关键步骤,旨在帮助开发者快速搭建安全、高效的本地大模型服务,实现数据安全与成本控制。

2026-03-04 20:27:23 648

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除