- 博客(1628)
- 收藏
- 关注

原创 LLM大模型:从新手到专家:AI大模型学习与实践完全指南
大模型,通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。这些大脑(模型)非常大,有的甚至有几千亿个参数,这些参数就像是大脑中的神经元,它们通过复杂的计算来理解和生成语言、图片等。举个例子,你可能听说过GPT-3,它就是一个非常著名的大模型。GPT-3可以通过理解你提出的问题,然后给出回答,或者根据你给它的提示,生成一篇文章、一个故事,甚至是一段代码。
2024-09-06 10:30:00
2826
1

原创 更高级的 RAG 架构:提升 AI 大模型回答准确性的前沿技术
本文介绍了更高级的 RAG 架构,也详细介绍了更多的 RAG 技术,希望对你有所帮助。RAG 技术依然还在快速发展中,也还存在诸多挑战。前段时间微软发布了 GraphRAG 让 RAG 的应用延伸到了图领域。我相信,在今后 RAG 的应用将会越来越广泛,与 LLM 的结合越来越紧密,我们所使用的 AI 功能也肯定会更加强大。
2024-09-06 09:00:00
1722
1

原创 深入剖析:从落地场景到实现路径——14份报告揭秘大模型热点问题
生成式AI通过学习大量原始内容,生成新的、原本并不存在的数据、文本、图像或其他类型的内容,具有一定的创造性和想象力。生成式AI对企业带来了创新的机会和自动化的潜力,提高了产品设计、广告创作和个性化服务的水平,使企业能够更高效地自动生成内容、提供个性化的客户体验。2023年是生成式AI的突破时刻,也是中国大模型的发展“元年”。通用大模型的快速迭代推动着生成式AI市场的发展。当前,企业的重点已经从围绕基础大模型的兴奋点转向推动投资回报率的用例。
2024-09-01 12:45:00
2131

原创 从零到精通:详解如何训练大模型的完整指南,非常详细,收藏我这一篇就够了
尽管可以使用一些技巧方法来构造一些看起来特别平滑的指标来反对大模型涌现这个词汇,但是不可否认的事实是,在不同的尺寸变化或者数据量、计算量变化之后,人们可以非常明显地感知到大模型表现的巨大差异,这就是一个相变的结果,就像是炼制一门18连环刃的法器,从第一把的炼制到第18把,从个数的指标上来说是非常平滑的,但是从威力上来说,18把可以构建一个法阵,极大地增加了武器的威力,与之前不可同日而语。以及,另外一个可能,小模型每一层cos都小,有可能每一层在干不同的事,或者每一层都会注意到新的东西。
2024-08-21 22:06:26
3250

原创 【深入探讨】AI大模型的学习路径:理论构建、技术创新与应用实践
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。随着技术的不断进步和理论的不断完善,相信AI大模型学习将会在更多的领域展现出强大的应用潜力,为人类社会带来更多的便利和进步。算法优化是提升模型性能的重要手段。总的来说,AI大模型学习在医疗健康领域的应用将为医疗诊断、治疗和管理带来革命性的变革,有望提高医疗服务的效率和质量,最终造福于人类的健康。
2024-08-16 17:03:58
1804
原创 (2025年最新最全)程序员转型AI必看:2025年最详细AI大模型学习路线图与实战资源大全!
2025年,AI大模型技术席卷全球,从智能客服到医疗诊断,从代码生成到金融预测,其身影无处不在。面对技术变革浪潮,程序员凭借工程化思维和编程基础,转型AI大模型开发具有天然优势。本文结合一线开发经验与权威学习资源,为你梳理一条**拒绝内卷、高效转型**的实战路径,助你抓住时代风口。
2025-09-10 15:21:36
668
原创 初聊大模型:从零基础到精通的全方位路径解析,一篇就够了!
大模型,通常指的是在人工智能领域中的大型预训练模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。这些大脑(模型)非常大,有的甚至有几千亿个参数,这些参数就像是大脑中的神经元,它们通过复杂的计算来理解和生成语言、图片等。
2025-09-10 15:19:09
287
原创 保姆级教程:九步教你从零构建MCP AI Agent,程序员必学必藏!
本文详细介绍了从零开始构建MCP类型AI Agent的九个步骤:首先定义工具目标和背景,然后构建核心功能包括数据加载、向量化、本地存储和语义检索;接着进行本地测试并使用FASTMCP构建MCP服务器;随后配置AI Agent项目并在工具内部运行;最后通过使用MCP资源和扩展AI项目完成整个构建流程。通过这九个步骤,开发者可以系统性地构建、测试、部署和扩展功能强大的MCP AI Agent。
2025-09-10 15:14:29
647
原创 阿里Qwen3-Next惊艳亮相:800亿参数仅激活30亿,MoE架构实现10倍推理效率提升!
阿里即将开源Qwen3家族新成员Qwen3-Next-80B-A3B,采用极为稀疏的混合专家架构(MoE),总参数800亿但每次仅激活30亿,激活比例高达1:50。相比Qwen3-32B,其下游任务性能更强、训练成本降低不到1/10、长上下文推理吞吐量提升10倍以上。核心技术包括更激进的稀疏架构、混合注意力机制和多令牌预测技术,代表阿里下一代统一架构创新套件,有望在长上下文处理等领域树立新标准。
2025-09-10 15:12:52
296
原创 零基础Python微调LLM实战:从数据收集到本地Ollama部署,打造专属AI专家模型!
摘要 本文详细介绍了如何使用Python微调大型语言模型(LLM)并在本地部署。主要内容包括: 微调概念:通过特定领域数据调整预训练模型,使其适应特定任务,相比prompt工程提供更稳定的输出格式。 实施步骤: 数据准备:收集输入-输出配对数据(如HTML提取示例) 环境配置:利用Google Colab免费GPU资源 模型加载:选择轻量级模型如Phi-3 Mini 训练过程:使用Unsloth工具和LoRA适配器高效微调 本地部署:通过Ollama将微调后的模型转换为GGUF格式在本地运行。 该方法特别适
2025-09-10 15:06:27
402
原创 哪些专业更易实现高质量就业?!2025大学生就业必看:人工智能大模型,就业新风口攻略!
教育部最新发布的统计数据显示,2025年全国普通高校毕业生规模预计攀升至1179万人,这一数字不仅刷新历史纪录,更让“就业难”这一长期萦绕在高校毕业生群体中的挑战愈发凸显。在求职竞争日趋激烈的当下,专业选择不再只是学业方向的确定,更成为影响未来职业发展轨迹的关键决策——选对就业前景广阔的专业,无异于为职业生涯铺设了一条“快车道”。
2025-09-09 16:33:59
1074
原创 35+程序员,别只顾着写代码!这几个转行方向,或许更适合你!
程序员35岁后,无人问津、被下岗,说到底还是中国互联网企业普遍短命和中国程序员新人不断涌现导致的,前者是岗位的缩减,后者是供应的增加,两者一叠加,35岁程序员就成了背锅侠。
2025-09-09 16:13:38
603
原创 吴恩达定义Agentic AI:大模型未来已来,仍在使用2022年工作流的人将被淘汰!
吴恩达提出"Agentic AI"概念,将自主性视为光谱,打破"规模至上"的主流叙事。他认为当前瓶颈不在算力,而在缺乏能系统化定位和修正错误的团队。产品开发瓶颈已从写代码转移到决策层面,优秀产品经理需要深刻共情与直觉。他提出"雇佣AI而非人"的组织哲学,小团队借助AI工具效率远超传统大团队。未来关键是把企业专有流程转化为"可学习的组织记忆",善用AI的个人将获得超乎想象的能力增强,仍在使用2022年工作流的人将被淘汰。
2025-09-09 14:01:38
256
原创 【万字长文】一文带你入门大模型赋能“具身智能”:从入门到精通自主决策与学习!
本文系统梳理大模型赋能的具身智能研究进展,涵盖基础概念、大模型分类与通用能力提升、自主决策(分层与端到端范式)及具身学习方法。大模型显著提升了具身智能在开放环境中的感知、交互、规划能力,自主决策和具身学习成为核心方向。文章详细分析了分层决策的高层规划、低级执行和反馈提升,以及端到端决策的VLA模型,为AGI发展提供了重要路径。
2025-09-09 13:29:47
499
原创 大模型回答质量提升三大技术:RAG、微调与提示词工程深度解析!
本文介绍了优化大模型回答质量的三大技术:检索增强生成(RAG)通过连接外部知识库获取最新数据;微调(Fine-Tuning)通过专门训练使模型掌握特定领域知识;提示词工程通过优化输入引导模型生成更准确内容。这三种方法各有优劣,可组合使用,在准确性、时效性和成本间取得平衡。
2025-09-09 11:38:58
351
原创 【6周速成】大模型学习路径:零基础到精通,每天只需2.5小时,收藏这篇就够了!
这是理解许多算法(特别是深度学习算法)的关键。主要概念包括向量、矩阵、行列式、特征值和特征向量、向量空间以及线性变换。
2025-09-08 16:57:40
888
原创 【腾讯混元面经】大模型面试全解析:从训练流程到RLHF,收藏这份大模型通关秘籍!
本文详细分享了腾讯混元大模型的完整面试经历,包含一面和二面的技术问题,涵盖大模型训练与推理流程、MoE架构、神经网络反向传播、RLHF流程、强化学习算法、DeepSpeed优化方法等核心知识点。这些问题全面覆盖了大模型开发所需的关键技能,适合准备大模型相关岗位的求职者学习和收藏。
2025-09-08 14:58:34
728
原创 解决AI Agent不遵从指令问题:区别于传统Prompt方法,Parlant框架让AI行为可预测!
本文介绍Parlant开源框架,解决AI Agent不遵循指令的核心痛点。区别于传统Prompt方法,Parlant通过上下文匹配和强制执行确保AI严格按规则行动。提供Guidelines(行为准则)、Journeys(对话流程)等核心功能模块,特别适合金融、医疗等高可靠性场景需求。框架从设计层面解决AI可控性问题,被评价为"最优雅的对话AI框架",是严肃AI应用的理想选择。
2025-09-08 14:52:23
530
原创 RAG技术详解:让大模型拥有“外接大脑“,实时获取最新信息!
RAG技术解决大模型知识截止日期和私有数据壁垒两大短板,通过三步流程实现:资料转化为可检索向量存储;用户提问时检索相关资料;基于检索结果生成答案。该技术使用嵌入模型、向量数据库等工具,实现知识实时更新、保护私有数据、回答可追溯,是企业级大模型应用的刚需技术。
2025-09-08 14:48:36
611
原创 深入浅出:大模型注意力机制原理与实现详解!大模型学习
本文详细解析了大语言模型核心组件——注意力机制的工作原理与实现方法。文章从简化版自注意力机制入手,逐步讲解注意力得分计算、softmax归一化和上下文向量生成过程,并通过代码示例展示了完整的实现流程。注意力机制解决了长序列建模中信息丢失的问题,使模型能够关注输入序列中不同位置的重要性差异,是理解LLM的关键所在。
2025-09-08 14:41:44
839
原创 大模型技术演进与AI落地:从算力到应用,揭秘AGI时代的企业转型路径!!
该白皮书系统梳理了大模型技术从算力解决方案向应用全方案落地的演进路径,分析AI发展周期规律与大模型三大新阶段主线,详解强化学习框架优化、异构智算平台等核心技术,通过金融、汽车制造等行业案例展示AI落地价值,并展望AGI时代基础设施布局与企业智能化转型路径。
2025-09-06 07:30:00
770
原创 DeepSeek提示词实战:从零开始构建AI虚拟偶像,AI辅助元宇宙项目运营!
本文详细介绍了DeepSeek提示词的使用技巧,特别是为AI虚拟偶像制定元宇宙内容日历的方法。通过对比测试,展示了DeepSeek-R1和DeepSeek-V3模型的不同特点:R1更擅长创意输出,V3更严格遵守指令。文章提供了实用的提示词模板和转换技巧,并推荐了DeepSeek综合应用证书,帮助读者提升AI应用能力。
2025-09-06 07:00:00
888
原创 大模型应用开发面经:面试9家,拿到3个offer,薪资还行!!
大模型应用开发秋招面试经验分享:近半年面试阿里、腾讯等10余家公司,总结了LLM应用岗位的面试特点。面试题偏实践,主要考察RAG架构、微调原理、Agent设计等,算法题以DP为主,八股文占比减少。关键加分项是掌握微调技术并具备部署经验。建议集中面试时间、做好复盘、润色简历,重点关注项目效果评估。文中列举了高频面试题,包括LLM基础、Prompt工程、RAG优化等,并提供了大模型学习资源获取方式。薪资涨幅多在20%以内,需合理调整预期。
2025-09-05 15:19:47
857
原创 大模型应用实战:基于大模型的企业知识问答系统实现(企业AI智能客服)
文章介绍企业AI智能客服建设方案,针对传统客服面临的人工压力大、知识管理混乱等问题,提出基于大模型的智能客服解决方案。通过中心路由Agent和专项Agent架构,结合RAG知识库和业务系统对接,实现自动化任务闭环。该方案已在企业微信群应用,准确率达80%以上,开发成本低,适合企业快速部署。
2025-09-05 15:06:32
799
原创 【万字长文】从零开始掌握RAG检索增强生成技术:大模型应用的完整指南!
RAG(检索增强生成)技术通过检索外部知识库信息增强大模型回答能力,解决知识局限性和幻觉问题。文章详细介绍了RAG架构、工作流程及高级技术,包括分块、向量化、搜索索引、查询转换和智能体等。同时讨论了RAG融合技术及其优缺点,以及编码器和LLM微调方法,最后提供了RAG系统评估框架,帮助构建高效可靠的RAG应用。
2025-09-05 15:01:08
791
原创 首批失业程序员靠AI实现年入百万!
过去几年,程序员一直是很多人眼中的“金饭碗”职业:高薪、体面、技术门槛高。然而,随着技术的快速迭代和行业竞争的加剧,许多程序员开始面临生存压力。尤其是近两年,互联网行业进入“降本增效”阶段,裁员潮此起彼伏,传统开发岗位的需求减少,找不到工作的程序员也越来越多。然而,令人意想不到的是,这批“被迫转型”的程序员,反而通过AI找到了新的赚钱方式,一部分人甚至靠AI实现了年入百万。
2025-09-04 16:12:06
704
原创 35岁程序员困境:要么年薪百万,要么送外卖?
摘要:35岁程序员面临职场危机已成普遍现象,IT行业存在35岁简历直接淘汰、薪资倒挂等潜规则。典型出路包括转行滴滴司机、考公务员或降薪去国企。与此同时,大模型应用开发岗位异军突起,顶尖公司开出154万年薪,成为程序员转型新方向。该岗位要求具备工程能力、AI理解和业务洞察三重技能,市场需求旺盛但人才稀缺。文章建议通过系统学习大模型原理、实践项目和关注前沿技术来把握这一职业机遇,并提供了全套学习资源获取方式。
2025-09-04 16:08:15
950
原创 2025年AI开发新标准:6大MCP工具让你的开发效率提升40%!
MCP(模型上下文协议)正成为2025年AI开发新标准。本文精选6大MCP工具,包括GitHub MCP Server、GitMCP、Playwright MCP等,可提升开发效率25%-40%。这些工具让AI直接连接GitHub、文件系统和知识库,自动化重复工作,降低代码幻觉率,改善团队协作。
2025-09-04 16:06:16
849
原创 什么是提示词?构建提示词的结构化方法有哪些?大模型学习
本文是一份AI提示词工程全面指南,介绍了提示词的定义、结构化构建方法、实用技巧策略、常见错误及避坑指南,并提供了丰富的案例库资源。提示词工程是短期内落地应用AI的刚需和门槛。文章通过实例演示了如何从新手到资深水平逐步优化提示词,强调了明确目标、提供上下文等关键要素,并鼓励读者在实践中学习应用。
2025-09-04 16:01:19
575
原创 【保姆级教程】10分钟掌握!用Dify实现自然语言查询数据库,小白也能变身数据分析达人!
本文介绍如何使用Dify平台通过自然语言查询数据库,无需编写SQL代码即可获取数据并以Excel表格形式呈现。文章详细阐述了四个步骤:准备数据库连接信息、配置数据库插件、设置流程组件、执行查询并下载结果。该方法降低了数据获取门槛,使非技术背景人员也能在10分钟内自主完成数据查询,实现"数据获取的民主化",提高决策效率。
2025-09-04 15:52:28
541
原创 【面试急救】20道大模型面试问题详解(含答案),助你一臂之力,轻松应对AI大模型面试!
大型语言模型在生成式人工智能(GenAI)和人工智能(AI)中正变得越来越有价值。这些复杂的算法增强了人类的能力,并在各个领域促进了效率和创造力。节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。
2025-09-03 16:15:41
1041
原创 大模型学习不再难!别慌!字节跳动把大模型入门知识点整理成手册了,高清PDF开发下载,轻松抄作业!!
最近大模型是真火啊, 搞得我这老码农都跃跃欲试,想搭上这班通往未来的列车。 But… 看着那些密密麻麻的技术名词,那叫一个头大!别怕,咱也是从小白过来的, 走过弯路,踩过坑,才搞明白点门道! 今天,我把这份独家私藏的大模型学习路线图分享给大家, 绝对干货! 保证你不再迷路, 还能少走弯路!这份路线图,我给它分了三个阶段: 入门、上手、深挖。 你是想快速尝鲜应用,还是想深入了解原理?都给你安排的明明白白!
2025-09-03 15:53:50
853
原创 【超详细教程】LangChain+MCP智能体开发指南:零基础实现浏览器自动化,附完整代码!!大模型应用开发
本文详细介绍了如何使用LangChain框架接入MCP(Model Context Protocol)服务端,实现智能体开发。文章首先回顾了MCP的核心概念,然后通过环境搭建、配置文件编写和MCP客户端实现的具体步骤,结合PlayWright MCP浏览器自动化实例,完整展示了LangChain+MCP的接入流程。文中提供了可直接运行的代码,帮助开发者快速掌握利用MCP技术提升Agent开发效率的方法。
2025-09-03 15:39:34
770
原创 2025年最佳AI编程助手:Qwen3-Coder与Claude Code全方位对比,开发者必看!!大模型应用开发
本文深入对比了Qwen3-Coder与Claude Code两大AI编程助手。Qwen3-Coder采用开源MoE架构,擅长处理超长上下文和复杂全栈任务;Claude Code作为终端优先工具,提供透明可控的体验。文章从架构、功能、性能、成本到安全全面分析了两者的差异,帮助开发者根据需求选择适合的工具。无论是追求开源灵活性的团队,还是需要企业级稳定性的组织,都能找到提升开发效率的AI编程搭档。
2025-09-03 15:36:54
1652
原创 【保姆级教程】小白也能上手!使用AI快速设计测试用例的coze智能体搭建流程,一键生成测试用例思维导图!!
本文详细介绍了如何在Coze平台上搭建"用例设计智能体",该智能体支持上传多种格式的需求文档(文本、图片、doc、pdf、txt等及在线链接),并能生成测试用例并以思维导图形式输出。文章通过步骤详解,包括创建智能体、添加工作流、编写提示词、预览调试和发布等环节,帮助读者构建一个能自动生成测试用例的AI工具,显著提升测试效率。
2025-09-03 15:29:14
972
原创 (2025年最新)AI大模型终极学习路线图:从基础到AI大模型应用开发,一篇搞定,助你成为AI大模型技术专家!
答案是**不一定**!以DeepSeek、Qwq等为代表的大模型已经开源,算法不再是唯一的门槛。那么,大模型应用开发的企业招聘情况如何呢?事实上,**大部分企业只有20%的岗位是算法岗,而80%的岗位是AI应用开发岗**。大模型的开源意味着AI时代更需要的是基于大模型的新生产力工具,而非纯粹的算法研究。
2025-09-02 17:24:44
1148
原创 AI产品经理转行指南:从入门到精通,这些基本认知助你成功转型!
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
2025-09-02 17:22:08
756
原创 美团LongCat-Flash深度剖析:5600亿参数模型如何实现每token仅激活270亿参数的高效智能体!开源大模型
LongCat-Flash是美团推出的5600亿参数混合专家模型,通过零计算专家和快捷连接MoE两大创新,实现动态计算分配和通信-计算重叠,每token仅激活270亿参数。推理速度达100 token/秒,成本仅0.7美元/百万token,特别强化了智能体能力,在工具使用和环境交互方面表现卓越,为高效大模型发展指明了方向。
2025-09-02 17:20:32
669
原创 告别“大海捞针“!Dify元数据过滤功能详解,让AI检索效率提升300%!Dify知识库
文章详细介绍了Dify知识库的元数据过滤功能,包括字符串、数字和时间三种元数据类型及其应用场景。通过设置元数据字段和配置过滤条件,可以显著提升知识库检索效率和准确性。文章提供了从创建元数据到配置过滤的完整操作指南,并分享了智能客服系统优化的实战案例,展示了该功能如何将检索准确率提升40%,响应时间减少65.6%。最后给出了元数据设计的最佳实践和未来发展趋势,帮助用户打造真正的智能知识库。
2025-09-02 17:18:56
591
原创 小白也能轻松部署!手把手教你Coze_开发平台开源本地部署详细教程!大模型部署
本文详细介绍了字节跳动AI开发平台Coze的开源本地部署教程,包括系统要求、四步安装流程及常见问题解决方案。Coze采用Apache 2.0许可证,仅需2核CPU、4GB内存即可运行,虽功能略逊于公网版,但核心功能完备,适合开发者快速搭建AI智能体。
2025-09-02 17:17:38
562
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人