功城师-CSDN博客

原创程序员转行ai是否可行？

程序员转行AI是完全可行的。实际上，程序员具备了许多与AI相关的技能和知识，这为他们转行到AI领域打下了坚实的基础。首先，程序员已经具备了计算机科学和编程的知识。他们熟悉不同的编程语言和算法，这些对于理解和实现AI算法非常重要。此外，他们在处理数据和解决技术问题方面也具有一定的经验，这是AI开发过程中不可或缺的技能。

2025-05-16 13:20:33 544

原创科普大模型入门指南：定义、应用与训练方法

在当今人工智能的浪潮中，大语言模型（Large Language Models, LLMs）正在改变我们与技术互动的方式。这些复杂的模型不仅具备理解和生成自然语言的能力，还在医疗、金融、教育等众多领域展现出强大的应用潜力。然而，尽管它们在推动技术前沿方面发挥着重要作用，关于大模型的本质、训练机制和控制策略仍然存在许多未知。

2025-05-14 17:19:47 817

原创火爆全网！《LLM书》.PDF

本书是一本实用的生成式人工智能指南，重点介绍转换器和扩散模型。它涵盖了生成式人工智能项目的生命周期，包括用例定义、模型选择、微调和部署。

2025-05-14 17:12:20 425

原创 Qwen3技术报告英中对照版.pdf

Qwen3 是 Qwen 模型家族的最新版本，它在性能、效率和多语言能力方面都取得了显著进步。该模型系列包含从 0.6B 到 235B 参数规模不等的多种模型，包括密集型和专家混合型（MoE）架构，旨在满足不同下游应用的需求。

2025-05-14 16:49:51 876

原创【2025最新】大模型学习路线：这会是你见过最全最新的大模型学习路线_大语言模型强化学习技术路线

大模型学习路线建议先从主流的Llama开始，然后选用中文的Qwen/Baichuan/ChatGLM，先快速上手体验prompt工程，然后再学习其架构，跑微调脚本

2025-05-13 17:57:37 939

原创 2025最新大模型技术学习过程梳理

学习大模型技术也有几个月的时间了，之前的学习一直是东一榔头，西一棒槌，这学一点那学一点，虽然弄的乱七八糟，但对大模型技术也算有了一个初步的认识。因此，今天就来整体梳理一下大模型技术的框架，争取从大模型所涉及的理论，技术，应用等多个方面对大模型进行梳理。

2025-05-13 16:12:44 612

原创一个非常适合初学者来理解的大模型项目—《从零实现LLama3模型》

还不知道学大模型的有救了！发现一个非常适合初学者来理解大模型的项目,叫做从头开始实现LLama3。

2025-05-09 14:22:28 256

原创哈工深发布多模态Reasoning大模型综述：感知、推理、思考和规划

如今的模型早已超越“看图说话”，论文开篇指出：真正的智能需要融合视觉、语言、听觉等多维度信息。就像人类遇到问题时会结合所见所闻，模型也需要跨模态推理能力，比如看到“乌云密布”联想到“带伞”，听到“玻璃碎裂”判断可能发生意外。论文提出，多模态推理模型（LMRMs）是通向通用人工智能（AGI）的核心路径，但现有技术仍面临三大瓶颈：

2025-05-09 14:21:10 818

原创零基础人员如何入门AI？这是一份给你的学习路径指南（非常详细）零基础入门到精通，收藏这一篇就够了_零基础如何快速了解ai

AI已成趋势，这点自不必多言。如今网络上的AI课程可谓五花八门形形色色，让人眼花缭乱难辨真假。其实细究下来，不少都是通过贩卖焦虑吸引对AI一知半解的普通人报课。有感于此，我想给零基础的你，介绍一下入门AI路径指南。在介绍关于AI，零基础的你，可能还有以下这些常见的误解：（误）使用AI需要懂代码懂技术，是只有程序员才能使用的高科技。——（正）当前许多AI应用和服务使用门槛很低，无需编程知识即可使用，用户只需按照提示操作即可。

2025-05-07 21:57:23 1000

原创【万字详解】手把手带你一步步搭建RAGFlow（超干货）_ragflow安装教程

本篇给大家介绍一下RAGFlow的本地搭建，以下过程基于Ubuntu24，其它Linux系统的搭建方法也基本相同。先来温补一下，RAGFlow是一个基于对文档深入理解的开源 RAG（检索增强生成）引擎。它的作用是可以让用户创建自有知识库，根据设定的参数对知识库中的文件进行切块处理，用户向大模型提问时，RAGFlow先查找自有知识库中的切块内容，接着把查找到的知识库数据输入到对话大模型中再生成答案输出。它能凭借引用知识库中各种复杂格式的数据为后盾，为用户提供真实可信，少幻觉的答案。

2025-05-07 21:55:23 767

原创聊一聊国内大模型公司，面试心得和感受

这段时间面试了很多家，也学到了超级多东西。楼主这边背景是做基座预训练算法端为主的，对框架端和RL的内容有一定了解（面试能凑合），对于后端的知识比如ML compiler，kernel，cuda相关的了解就比较浅了（问到觉大概率挂）。硬件几乎不太懂。大模型这方向真的卷，面试时好多新模型，新paper疯狂出，东西出的比我读的快。Research岗位对工程也有要求，工程端也需要了解模型。感觉比较硬核的岗位，尤其初创公司都是对好几个点都有要求的（应用，模型，框架，底层后端，硬件）。

2025-04-23 22:54:40 1031

原创 RAG+AI工作流+Agent：LLM框架该如何选择，全面对比MaxKB、Dify、FastGPT、RagFlow等

MaxKB = Max Knowledge Base，是一款基于 LLM 大语言模型的开源知识库问答系统，旨在成为企业的最强大脑。它能够帮助企业高效地管理知识，并提供智能问答功能。想象一下，你有一个虚拟助手，可以回答各种关于公司内部知识的问题，无论是政策、流程，还是技术文档，MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等

2025-04-23 22:43:10 1095

原创学LLM建议:大家有空可以去小破站学大模型❗

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-04-16 23:03:11 667

原创关于2025年人工智能agent的5个预测_ai agent 预测

2024年是人工智能agent走向主流的一年。从年初黑客们那些笨拙、昂贵且充满激情的项目开始，agent现在已经得到了科技巨头、SaaS公司、学术研究人员等更多人的接纳。与此同时，他们的形式也在不断增多，从文本扩展到多种模式，并在现实世界中执行行动的能力也变得更强大。在这里，我预测2025年agent领域的轨迹，因为它开始在人工智能社区之外产生影响力。1. 对agent的兴趣持续激增今年，对人工智能agent的兴趣爆发式增长，谷歌搜索量增加了十倍。

2025-04-16 22:58:03 869

原创年薪五十万起，大模型公司偏爱哪种毕业生，企业对人才的需求自然已经水涨船高

自从OpenAI打开了生成式AI的潘多拉魔盒，大模型依然是2024年最炙手可热的风口，硅谷作为技术发源地，人才蜂拥。任何优秀的组织，一定都是找到了一种方法和对应的工具，去最大程度地激发每一个个体的创造力。但更重要的，是抓住那些稍纵即逝的天才灵感。《AI光年》通过走访一些AI公司员工，记录当下中外大模型公司的变化：掌握未来的人才在哪里？是为第一篇。1998年出生的林菲，成了AI风口下第一批就业的年轻人。林菲是今年毕业的计算机专业硕士。

2025-04-11 22:43:14 711

原创传统预训练正走向终结，推理优化与后训练提升有限，大模型今后如何突破发展瓶颈？

主动构建多任务样本，实现数据生成与学习闭环。无需大规模人工标注，即可高效扩展预训练数据，根本性缓解当前高质量多模态数据稀缺的问题。

2025-04-11 22:32:43 1015

原创我真的花了很久，才理清大模型到底该怎么学！

说句实在的，很多人以为学大模型就是搞点提示词、调个 API，就能搞定一切。但真想“弄懂它”，甚至“做出点东西”来，不啃几本靠谱的书，真的不行。我一开始也是刷了一堆教程，收藏了几十个 AI 工具帖，但一到自己动手就抓瞎。直到我静下心认真啃完这些书，才发现——原来很多问题，书里早就帮你解答了。

2025-04-08 18:25:47 620

原创知识图谱+知识库RAG项目Yuxi-Know及大模型推理内部可视化工具OpenMAV实现拆解

之前有比如Bertvis项目，对每一层的推理进行可视化，所以类似的工具轮子也越来越多，如最近又多了个可视化大模型内部运作的开源工具OpenMAV()，基于Python的工具，旨在在文本生成过程中实时可视化大语言模型（LLM）的内部工作原理。该工具通过交互式的基于终端的界面，为用户提供对模型内部结构的洞察。通过交互式终端界面，可实时可视化LLM在生成文本时的内部状态，包括注意力分布、MLP激活值和Token预测概率等，可通过插件轻松扩展可视化功能，并支持多种模型，如 GPT-2、Llama等。

2025-04-08 18:21:37 741

原创世界级AI大佬吴恩达著作：LLM CookBook 汉化版本教程

🚀本教程面向入门 LLM 的开发者，深入浅出地介绍了对于开发者，如何构造Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能，是入门 LLM 开发的经典教程；

2025-04-01 23:23:33 742

原创图解大模型训练之：数据并行（DP、DDP、ZeRO、零冗余优化)

1、在DP中，每个GPU上都拷贝一份完整的模型，每个GPU上处理batch的一部分数据，所有GPU算出来的梯度进行累加后，再传回各GPU用于更新参数2、DP多采用参数服务器这一编程框架，一般由若个计算Worker和1个梯度聚合Server组成。Server与每个Worker通讯，Worker间并不通讯。因此Server承担了系统所有的通讯压力。基于此DP常用于单机多卡场景。3、异步梯度更新是提升计算通讯比的一种方法，延迟更新的步数大小决定了模型的收敛速度。

2025-04-01 23:19:24 751

原创程序员末日？AI大模型已替代45%岗位！2025年自救指南速看

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-04-01 23:16:34 1204

原创做完RAG图片搜索后，才明白过去对RAG的理解完全不够

简单来说，图片RAG是一种将图像检索与生成模型结合的技术。它的核心思想是：先从海量数据中检索出与用户输入最相关的图像或信息，再将这些检索结果作为上下文，输入到生成模型中，输出高质量的响应。

2025-03-27 23:14:27 982

原创【2024医疗人工智能报告】|《2024年医疗人工智能研究报告-生成式AI爆发，医疗人工智能走到新的十字路口》||（附下PDF）_2024医疗健康ai大模型行业研究报告

导读《2024年医疗人工智能研究报告》由蛋壳研究院发布，深入探讨了医疗人工智能在2024年的发展现状与未来趋势。报告指出，随着大语言模型和生成式AI技术的快速发展，医疗领域的多个场景如互联网医疗、医学影像、新药研发等正经历重塑，释放出前所未有的价值。然而，同时强调，在融资形势严峻的背景下，医疗AI企业必须全面考量场景、技术、风控、商业化等多方面因素，以实现决策的精准性。研究核心聚焦于“场景”与“产品”，通过分析医院、药企、械企的供需逻辑和实战案例，为AI企业在布局、选品、研发、商业化方面提供参考建议。

2025-03-27 23:06:35 477

原创厦大团队：DeepSeek大模型及其企业应用实践（150页PPT，企业人员的大模型宝典）

12025年春节期间，DeepSeek的发布震撼全球，标志着人工智能大模型进入“普惠”时代，大模型开始深刻影响我们工作和生活的方方面面。每个人都有必要学习、了解和使用大模型。你是否渴望揭开大模型的神秘面纱？厦大团队带着满满诚意，重磅推出 4 个大模型科普报告！面向社会大众，我们用 140 页 PPT 深入浅出地讲解大模型概念、技术与应用实践，让每个人都能轻松读懂大模型。对高校而言，120页PPT深度剖析 DeepSeek 大模型如何赋能教学与科研，为学术创新注入新动力。

2025-03-25 22:12:42 369

原创抖音电商如何用 Agent 重做智能客服？一键获取同款！

在传统电商客服体系中，服务流程通常由智能客服系统与人工客服团队协同完成，并衍生出一系列前后端的配套服务。尽管大模型已经诞生近两年半，目前 AI 客服大都还停留在 SOP 辅助模式或 Copilot 协作模式。“不配置就回复不了”、“机械式单轮问答”、“幻觉问题误导客户”、“无法识别判读意图，答非所问”等问题仍然普遍存在。为了让 AI 客服更智能化，，在 AI 客服场景构建了人机协作的新型服务范式。当前主流智能客服系统通常采用的服务流程为：用户自主查询→机器人应答→转接人工。

2025-03-25 22:03:24 1127

原创 2025年最火技术岗来袭：大模型应用开发工程师，你准备好了吗？

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-03-23 00:02:25 942

原创一文彻底搞懂大模型-RAG

一、检索增强生成（RAG）什么是RAG？RAG（Retrieval-Augmented Generation，检索增强生成），RAG是一种 AI 框架，它将传统信息检索系统（例如数据库）的优势与生成式大语言模型 (LLM) 的功能结合在一起。LLM通过将这些额外的知识与自己的语言技能相结合，可以撰写更准确、更具时效性且更贴合具体需求的文字。什么是RAG？如何理解RAG？通过上一个问题，我们知道了什么是RAG？了解到RAG是一种结合了信息检索、文本增强和文本生成的自然语言处理（NLP）的技术。RAG的目的

2025-03-21 10:52:40 1132

原创大模型电子书学习推荐 |6本大模型书籍（附pdf版），看完少走一半弯路

自学大模型这6本书你一定要看，学完你就是大模型大师了

2025-03-21 10:45:39 959

原创小白也能微调大模型：LLaMA-Factory使用心得_llama factory

大模型火了之后，相信不少人都在尝试将预训练大模型应用到自己的场景上，希望得到一个垂类专家，而不是通用大模型。目前的思路，一是RAG(retrieval augmented generation)，在模型的输入prompt中加入尽可能多的“目标领域”的相关知识，引导模型在生成时尽量靠拢目标领域，运用prompt中给予的目标知识；二是有监督微调，用适量的专业领域的数据（或混通用语料）让模型更能生成目标场景的内容。本文主要讲的就是微调。

2025-03-17 23:52:12 1023

原创 2025大模型时代已至，产品经理如何紧跟时代步伐？

在数字化浪潮的推动下，人工智能领域正迎来一场技术革命，而大模型技术的崛起无疑是这场革命中的明星。作为产品经理，我们不仅要洞察市场趋势，更要紧跟技术发展，以创新的思维和敏锐的洞察力，引领产品走向未来。本文将探讨大模型技术的市场现状，以及产品经理如何入行大模型，共同开创智能新时代。大模型技术的崛起为产品经理提供了巨大的机遇和挑战。作为产品经理，我们要紧跟时代步伐，深入了解大模型技术，洞察市场需求，打造创新产品，并组建专业团队支持产品的研发和迭代。只有这样，我们才能在这个充满机遇和挑战的时代中立足并取得成功。

2025-03-17 23:50:36 814

空空如也

空空如也