大耳朵爱学习-CSDN博客

原创 Java开发选手暑期3月勇闯转大模型算法上岸

在回顾还是觉得很神奇，其实研一就很想做算法，自学了机器学习深度学习。后来觉得为了求稳，以及实验室同学全部都做后端，就又开始java开发并且去实习。直到3月份，机缘巧合下一个师兄说，为什么不做大模型呢，风口在这里为什么不上呢？

2025-05-16 11:36:37 795

原创 Deepseek本地部署详细指南！从 Ollama 到个人知识库应用

Deepseek本地部署详细指南！从 Ollama 到个人知识库应用

2025-05-16 11:32:39 1037

近两年LLM在学术界与工业界的发展大家都有目共睹。到了今年，以预训练LLM为代表的大模型PK上半场已然结束，接下来就要进入下半场大模型2.0时代了。那么在这新赛道，关于大模型我们还有什么可做的创新？要知道，如今的大模型研究已经从单纯的"规模竞赛"转向"效能突破"与"应用重构"，研究者们致力于构建可持续进化的智能生态系统。因此，多模态大模型、智能体agent等这类围绕大模型技术演进核心矛盾的方向尤其值得关注。

2025-05-14 19:53:39 540

原创【面试必备】大模型经典面试题+详细答案：背八股文才是王道，不然你面试撑不过五分钟_大模型面试题

最近秋招正在如火如荼地进行中，看到很多人的简历上都包含大模型相关的工作，各家大厂和初创都很舍得给钱，动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。

2025-05-14 19:50:52 617

原创 AI大模型与企业数字化转型：业务“数字化”是必要之路

有了大模型之后，是不是就不需要开展业务“数字化”，只需要把问题直接丢给AI去解决呢？基于数字看板、数字孪生的传统方法在应对实现了“业务活动步骤化”、“步骤环节要素化”、“要素数据规格化”的业务数据时，就像数码照片的清晰度一样，效果是可度量、可预测、可控制的。AI大模型可以有效应对自然语言描述、图片、视频等非结构化数据，但其基于概率统计和模式匹配的基本原理，决定了在基于非结构化数据开展智能生成和决策时，其效果难以度量和预测，无法避免“AI幻觉”这类错误。

2025-05-09 14:27:38 724

原创国内首份《2025央国企AI+数智化转型研究报告》

今天分享一份由中国软件行业协会信息主管（CIO）分会、晋阳数字经济产业研究院、数字产业创新研究中心、锦囊专家联合发布的国内首份《2025央国企AI+数智化转型研究报告》。

2025-05-09 14:25:46 527

原创 AI不只大模型？AI Agent到底有多强？

今天来和大家聊一个当下科技领域特别火爆的概念——AI Agent！

2025-05-08 17:58:14 792

原创干货：2025大模型学习路线图（附大模型学习资源分享）

零基础想要入门大模型，langchain、transformer、bert这些是要学的，但是你上来就从这里开始学习，那你就大错特错了！作为一名有一定编程经验的程序员，我们真的没必要一上来就把时间精力全部投入到复杂的理论、纠结选择什么编程语言和各种晦涩的数学公式上，这样不仅容易让你精神内耗，最终演变成入门到放弃。

2025-05-08 17:55:27 851

原创 DeepSeek-R1发布100天后：全面复盘推理大模型复现研究及未来！

推理语言模型：RLMs （OpenAI-o1/o3/o4、DeepSeek-R1以及QwQ系列）的最新发展标志着大型语言模型的一次重大演变。特别，的发布引发了广泛的社会影响，但其并实现细节未完全开源。MiroMind&复旦&新加坡国立大学等总结了近期的，主要关注这两个主要方向，介绍了当前复现研究在数据构建、方法设计和训练过程中的细节、。**一、**是通过高质量的数据集来提升推理语言模型（）的关键方法之一。**二、**数据集主要涵盖数学和编程问题，并确保在训练过程中可以验证模型的输出。

2025-05-07 21:52:00 853

原创 2025年传统程序员如何转行到AI大模型? AI大模型学习路线路径，巨详细！！_程序员如何转人工智能

传统程序员转行到AI大模型领域是一个既充满挑战又蕴含机遇的过程。以下是一份详细的指南，旨在帮助程序员顺利过渡到这个新兴且快速发展的行业。

2025-05-07 21:49:23 522

原创干货分享|检索增强生成技术RAG：向量化与大模型的结合

本文我们将来学习一个与现在 AGI 时代合作紧密的技术 RAG, 这是每个 AIGC 方向开发不得不掌握的能力。*为什么需要使用RAG*该模块将介绍 RAG 的应用场景，以及与模型微调方案的差异*模型Agent需要额外的信息穿透*使用模型Agent时，对于一些不在基座模型训练数据中的信息，模型无法做出精准回答，即使回答了，也是错误的答复。当模型 Agent 用于外部或者一些通用场景时，这个问题可能还可以被忽略。**但在内网场景，或者存在信息壁垒的场景使用时，这个问题会严重影响用户的体验，**比如下列的一些场

2025-05-06 17:27:11 980

原创资料分享丨2025年全球AI编程（AI Coding）市场洞察研究报告（附34页文件下载）

《2025年全球AI编程市场洞察研究报告》由亿欧智库倾力打造，深度剖析AI编程领域发展现状与趋势。报告涵盖行业背景、工具分类、商业模式、市场趋势等多维度内容，评估主流工具表现，分析代表产品优势劣势，为从业者、企业及投资者提供全方位市场洞察，助力把握AI编程发展机遇。

2025-05-06 17:18:24 247

原创 RAG的12种调优策略_rag调优

随着越来越多的开发人员在创建RAG流程的原型方面积累经验，讨论如何使RAG流程达到投入生产所需的性能变得更为重要。本文主要阐述了以下调优点：

2025-04-23 22:40:53 999

原创 2025大模型面试题快问快答！必考速记！背完通过率（95%）

大模型面试25年春招必问，背完通过率（95%）

2025-04-23 22:38:39 613

原创 2025年必须掌握的LLM训练三阶段

01近日，DeepSeek-R1 横空出世，全球AI股票应声暴跌。他们打造了一款强大的推理模型，并将其开源。这款模型之强大，足以媲美OpenAI的o1模型，而成本却仅为后者的一小部分。他们的秘诀在于其大语言模型（LLM）的训练方式。正因如此，今天我们将一步步解析这一训练过程，以期最终能够设计出激动人心的新方法，并像DeepSeek那样创造出更加强大的模型。闲话少说，我们来研究一下吧！02大语言模型训练的第一阶段称为。预训练是一种无监督学习方法，帮助大模型掌握语言规则并构建世界认知框架。

2025-04-16 22:51:55 860

原创 AI小白到高手：大型语言模型你必须知道的事！

论你是刚接触 AI 的新手，还是对 AI 已有一定了解的朋友，这篇文章都会为你提供清晰又深入的理解。理解大型语言模型（LLM）其实很简单—— 你只要想象它就是在玩“文字接龙”的游戏。

2025-04-16 22:46:16 844

原创 2025如何抓住AI未来！《多模态大模型：技术原理与实战》揭秘下一代AI核心技术，大模型入门必备！

本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战，本书还详细介绍了使用大模型为商业赋能的3个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。本书适用于从事人工智能工作的专业技术人员，比如算法工程师、研发工程师等，也适用于对多模态大模型感兴趣的各类从业者，比如产品经理、项目经理和各级管理人员等。

2025-04-11 22:27:40 370

原创本地离线部署Ai大模型的三种方案，含安装教程！_离线大模型

• 能够利用大模型解决相关实际项目需求：大数据时代，越来越多的企业和机构需要处理海量数据，利用大模型技术可以更好地处理这些数据，提高数据分析和决策的准确性。• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；定制和创建您自己的模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-04-11 22:11:28 754

原创十天速成大模型—路径规划篇_路径规划大模型

了解当前主流的大模型，包括 GPT 系列、BERT、DALL-E、CLIP 等。探讨这些模型的架构、应用场景、优缺点，并了解它们在各自领域的影响力和应用实例。

2025-04-07 23:45:03 819

原创大模型入门超全指南来了！人大团队力作，内附一线开发经验

大语言模型》教材力求全面详实、层次清楚、循序渐进，从预训练到微调与对齐，从使用技术到评测应用，基本全覆盖大语言模型训练与使用的全流程。第一部分背景与基础知识，介绍大语言模型的背景知识和重要概念，GPT系列模型的发展历程，以及大模型相关的资源信息。第二部分预训练，介绍预训练数据的准备工作，大语言模型的架构，以及预训练过程涉及的相关技术。第三部分微调与对齐，介绍指令微调和轻量化微调方法，以及以强化学习算法RLHF为代表的大模型人类对齐技术。第四部分使用与评测。

2025-04-07 23:43:37 587

原创 2025最新大模型算法岗面试八股文【基础篇100题】，金九银十季，涨薪涨薪（精简、纯手打）_大模型算法发八股文

最近春招正在如火如荼地进行中，看到很多人的简历上都包含大模型相关的工作，各家大厂和初创都很舍得给钱，动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。本文总结了100道大模型算法岗常见的面试题（含答案），篇幅限制，部分内容如下。一、基础篇1、目前主流的开源模型体系有哪些？Transformer体系：由Google提出的Transformer 模型及其变体，如BERT、GPT 等。PyTorch Lightning：一个基于PyTorc

2025-04-01 23:37:36 729

原创 2025最新AI大模型应用开发的核心技术学习线路看这里

现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。大模型的开源意味着AI时代更需要的是基于大模型的新生产力工具，而非纯粹的算法研究。

2025-04-01 23:34:07 1143

原创检索增强生成（RAG）深度解析

RAG通过检索与生成的协同，突破了传统生成模型的静态知识局限，成为解决时效性与专业性的有效方案。随着多模态检索（如图文结合）和自适应学习的发展，RAG或将成为下一代AI系统的核心架构之一。

2025-04-01 23:28:09 691

原创 2025年3月份我放弃了前端，转行了！！！猜我得到了什么?_前端转行不干互联网了

![为什么离开这个行业这个问题其实我真的真的想了很多很多，我也分享给你们我的想法，希望可以帮助想继续深耕这个行业的继续深耕，犹豫想转行的帮助你们确定转行。综上考虑，我个人直接决定离开前端，因为这4个，都让我觉得在前端深耕会更好。但往往对于我最好的，却让我无法走出下一步，我挣扎，焦虑，走不出自己的舒适圈。害怕未知事物，这一切，都让我忘记了，我20年去上海找工作的日子，那时候蠢蠢的，呆呆的，啥也不会，靠着几个面试题，东奔西走，到处面试。失败远远大于成功，但我敢于去做。现在呢，面对前端行业，乃至于整体行业的经济

2025-03-27 23:03:57 373

原创一文读懂「Lang Chain」_langchain

LangChain是一个强大的框架，旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口，可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互，将多个组件链接在一起，并集成额外的资源，例如 API 和数据库。官方文档：https://python.langchain.com/en/latest/中文文档：https://www.langchain.com.cn/

2025-03-27 23:02:04 844

原创 2024大模型安全实践白皮书｜附42页PDF文件下载

本报告在分析了大模型发展趋势挑战的基础上，提出了大模型安全实践总体框架，并从安全性、可靠性、可控性以及评测四个角度对大模型安全技术进行了深度剖析。最后，在大模型安全未来发展趋势基础上，提出了大模型安全“五维一体”治理框架，对于大模型安全生态形成、大模型可持续发展具有非常重要和积极的意义。

2025-03-25 22:20:34 342

原创全景解读 LLM Posting-Train（后训练）技术

2023 年，当 ChatGPT 惊艳世界时，很多人第一次意识到：原来 AI 不仅能背课文，还能写代码、编故事、解数学题。（Pretraining）和预训练阶段通过海量文本数据（通常达到 TB 级别）的自我监督学习，使模型掌握基本的语言规律和世界知识。但仅有预训练的LLM，就好像刚学会六脉神剑的段誉，一身内功，但不会施展。这时，我们就需要通过「后训练」来给模型能力进行「塑型」—— 通过特定方法让模型在医疗诊断、法律咨询、编程开发等专业领域大显身手，同时学会遵守伦理规范、避免信口开河。

2025-03-23 00:00:10 1024

原创浙江大学强势出品！《大模型基础》教材已开源！附PDF文档_大模型基础pdf

这本浙大出品的大模型基础入门书籍：《大模型基础》你绝对不能错过！本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章，深入探讨了大模型的工作原理和使用方法-一提示工程，并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用，以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例，无论您是技术领域的专业人士，还是对新兴技术充满好奇心的读者，希望本书能激发您的思考，并为您展示一个崭新的创作世界。

2025-03-21 10:48:41 409

原创手把手教你用Docker部署Dify平台，打造可视化LLM应用环境_dify docker部署

Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务（Backend as Service）和LLM Ops的理念，使开发者可以快速搭建生产级的生成式AI应用。即使你是非技术人员，也能参与到AI应用的定义和数据运营过程中。Dify内置了构建LLM应用所需的关键技术栈，包括对数百个模型的支持、直观的Prompt编排界面、高质量的RAG引擎、稳健的Agent框架、灵活的流程编排，并同时提供了一套易用的界面和API。这为开发者节省了许多重复造轮子的时间，使其可以专注在创新和业务需求上。”

2025-03-21 10:47:30 972 1

空空如也

空空如也