自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(484)
  • 收藏
  • 关注

原创 Java开发选手暑期3月勇闯转大模型算法上岸

在回顾还是觉得很神奇,其实研一就很想做算法,自学了机器学习深度学习。后来觉得为了求稳,以及实验室同学全部都做后端,就又开始java开发并且去实习。 直到3月份,机缘巧合下一个师兄说,为什么不做大模型呢,风口在这里为什么不上呢?

2025-05-16 11:36:37 795

原创 Deepseek本地部署详细指南!从 Ollama 到个人知识库应用

Deepseek本地部署详细指南!从 Ollama 到个人知识库应用

2025-05-16 11:32:39 1037

原创 2025年,大模型LLM还有哪些可研究的方向?

近两年LLM在学术界与工业界的发展大家都有目共睹。到了今年,以预训练LLM为代表的大模型PK上半场已然结束,接下来就要进入下半场大模型2.0时代了。那么在这新赛道,关于大模型我们还有什么可做的创新?要知道,如今的大模型研究已经从单纯的"规模竞赛"转向"效能突破"与"应用重构",研究者们致力于构建可持续进化的智能生态系统。因此,多模态大模型、智能体agent等这类围绕大模型技术演进核心矛盾的方向尤其值得关注。

2025-05-14 19:53:39 540

原创 【面试必备】大模型经典面试题+详细答案:背八股文才是王道,不然你面试撑不过五分钟_大模型面试题

最近秋招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。

2025-05-14 19:50:52 617

原创 AI大模型与企业数字化转型:业务“数字化”是必要之路

有了大模型之后,是不是就不需要开展业务“数字化”,只需要把问题直接丢给AI去解决呢?基于数字看板、数字孪生的传统方法在应对实现了“业务活动步骤化”、“步骤环节要素化”、“要素数据规格化”的业务数据时,就像数码照片的清晰度一样,效果是可度量、可预测、可控制的。AI大模型可以有效应对自然语言描述、图片、视频等非结构化数据,但其基于概率统计和模式匹配的基本原理,决定了在基于非结构化数据开展智能生成和决策时,其效果难以度量和预测,无法避免“AI幻觉”这类错误。

2025-05-09 14:27:38 724

原创 国内首份《2025央国企AI+数智化转型研究报告》

今天分享一份由中国软件行业协会信息主管(CIO)分会、晋阳数字经济产业研究院、数字产业创新研究中心、锦囊专家联合发布的国内首份《2025央国企AI+数智化转型研究报告》。

2025-05-09 14:25:46 527

原创 AI不只大模型?AI Agent到底有多强?

今天来和大家聊一个当下科技领域特别火爆的概念——AI Agent!

2025-05-08 17:58:14 792

原创 干货 :2025大模型学习路线图 (附大模型学习资源分享)

零基础想要入门大模型,langchain、transformer、bert这些是要学的,但是你上来就从这里开始学习,那你就大错特错了!作为一名有一定编程经验的程序员,我们真的没必要一上来就把时间精力全部投入到复杂的理论、纠结选择什么编程语言和各种晦涩的数学公式上,这样不仅容易让你精神内耗,最终演变成入门到放弃。

2025-05-08 17:55:27 851

原创 DeepSeek-R1发布100天后:全面复盘推理大模型复现研究及未来!

推理语言模型:RLMs (OpenAI-o1/o3/o4、DeepSeek-R1以及QwQ系列)的最新发展标志着大型语言模型的一次重大演变。特别,的发布引发了广泛的社会影响,但其并实现细节未完全开源。MiroMind&复旦&新加坡国立大学等总结了近期的,主要关注这两个主要方向,介绍了当前复现研究在数据构建、方法设计和训练过程中的细节、。**一、**是通过高质量的数据集来提升推理语言模型()的关键方法之一。**二、**数据集主要涵盖数学和编程问题,并确保在训练过程中可以验证模型的输出。

2025-05-07 21:52:00 853

原创 2025年传统程序员如何转行到AI大模型? AI大模型学习路线路径,巨详细!!_程序员如何转人工智能

传统程序员转行到AI大模型领域是一个既充满挑战又蕴含机遇的过程。以下是一份详细的指南,旨在帮助程序员顺利过渡到这个新兴且快速发展的行业。

2025-05-07 21:49:23 522

原创 干货分享|检索增强生成技术RAG:向量化与大模型的结合

本文我们将来学习一个与现在 AGI 时代合作紧密的技术 RAG, 这是每个 AIGC 方向开发不得不掌握的能力。*为什么需要使用RAG*该模块将介绍 RAG 的应用场景,以及与模型微调方案的差异*模型Agent需要额外的信息穿透*使用模型Agent时,对于一些不在基座模型训练数据中的信息,模型无法做出精准回答,即使回答了,也是错误的答复。当模型 Agent 用于外部或者一些通用场景时,这个问题可能还可以被忽略。**但在内网场景,或者存在信息壁垒的场景使用时,这个问题会严重影响用户的体验,**比如下列的一些场

2025-05-06 17:27:11 980

原创 资料分享丨2025年全球AI编程(AI Coding)市场洞察研究报告(附34页文件下载)

《2025年全球AI编程市场洞察研究报告》由亿欧智库倾力打造,深度剖析AI编程领域发展现状与趋势。报告涵盖行业背景、工具分类、商业模式、市场趋势等多维度内容,评估主流工具表现,分析代表产品优势劣势,为从业者、企业及投资者提供全方位市场洞察,助力把握AI编程发展机遇。

2025-05-06 17:18:24 247

原创 RAG的12种调优策略_rag调优

随着越来越多的开发人员在创建RAG流程的原型方面积累经验,讨论如何使RAG流程达到投入生产所需的性能变得更为重要。本文主要阐述了以下调优点:

2025-04-23 22:40:53 999

原创 2025大模型面试题快问快答!必考速记!背完通过率(95%)

大模型面试25年春招必问,背完通过率(95%)

2025-04-23 22:38:39 613

原创 2025年必须掌握的LLM训练三阶段

01近日,DeepSeek-R1 横空出世,全球AI股票应声暴跌。他们打造了一款强大的推理模型,并将其开源。这款模型之强大,足以媲美OpenAI的o1模型,而成本却仅为后者的一小部分。他们的秘诀在于其大语言模型(LLM)的训练方式。正因如此,今天我们将一步步解析这一训练过程,以期最终能够设计出激动人心的新方法,并像DeepSeek那样创造出更加强大的模型。闲话少说,我们来研究一下吧!02大语言模型训练的第一阶段称为。预训练是一种无监督学习方法,帮助大模型掌握语言规则并构建世界认知框架。

2025-04-16 22:51:55 860

原创 AI小白到高手:大型语言模型你必须知道的事!

论你是刚接触 AI 的新手,还是对 AI 已有一定了解的朋友,这篇文章都会为你提供清晰又深入的理解。理解大型语言模型(LLM)其实很简单—— 你只要想象它就是在玩“文字接龙”的游戏。

2025-04-16 22:46:16 844

原创 2025如何抓住AI未来!《多模态大模型:技术原理与实战》揭秘下一代AI核心技术,大模型入门必备!

本书详细介绍了大语言模型和多模态大模型的发展历史、技术原理和亮点、主要的开源框架、配套工具、部署细则和实战案例。为了让读者更好地进行大模型的应用实战,本书还详细介绍了使用大模型为商业赋能的3个应用案例。期望本书能够帮助读者打开通往大模型尤其是多模态大模型的学习、实战和商业成功之路。本书适用于从事人工智能工作的专业技术人员,比如算法工程师、研发工程师等,也适用于对多模态大模型感兴趣的各类从业者,比如产品经理、项目经理和各级管理人员等。

2025-04-11 22:27:40 370

原创 本地离线部署Ai大模型的三种方案,含安装教程!_离线大模型

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;定制和创建您自己的模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-04-11 22:11:28 754

原创 十天速成大模型—路径规划篇_路径规划 大模型

了解当前主流的大模型,包括 GPT 系列、BERT、DALL-E、CLIP 等。探讨这些模型的架构、应用场景、优缺点,并了解它们在各自领域的影响力和应用实例。

2025-04-07 23:45:03 819

原创 大模型入门超全指南来了!人大团队力作,内附一线开发经验

大语言模型》教材力求全面详实、层次清楚、循序渐进,从预训练到微调与对齐,从使用技术到评测应用,基本全覆盖大语言模型训练与使用的全流程。第一部分 背景与基础知识,介绍大语言模型的背景知识和重要概念,GPT系列模型的发展历程,以及大模型相关的资源信息。第二部分 预训练,介绍预训练数据的准备工作,大语言模型的架构,以及预训练过程涉及的相关技术。第三部分 微调与对齐,介绍指令微调和轻量化微调方法,以及以强化学习算法RLHF为代表的大模型人类对齐技术。第四部分 使用与评测。

2025-04-07 23:43:37 587

原创 2025最新大模型算法岗面试八股文【基础篇100题】,金九银十季,涨薪涨薪(精简、纯手打)_大模型算法发八股文

最近春招正在如火如荼地进行中,看到很多人的简历上都包含大模型相关的工作,各家大厂和初创都很舍得给钱,动辄百万年包也变得不再稀奇。因此在大模型纵横的这个时代,不仅大模型技术越来越卷,就连大模型相关的岗位和面试也开始越来越卷了。本文总结了100道大模型算法岗常见的面试题(含答案),篇幅限制,部分内容如下。一、基础篇1、目前主流的开源模型体系有哪些?Transformer体系:由Google提出的Transformer 模型及其变体,如BERT、GPT 等。PyTorch Lightning:一个基于PyTorc

2025-04-01 23:37:36 729

原创 2025最新AI大模型应用开发的核心技术学习线路看这里

现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。大模型的开源意味着AI时代更需要的是基于大模型的新生产力工具,而非纯粹的算法研究。

2025-04-01 23:34:07 1143

原创 检索增强生成(RAG)深度解析

RAG通过检索与生成的协同,突破了传统生成模型的静态知识局限,成为解决时效性与专业性的有效方案。随着多模态检索(如图文结合)和自适应学习的发展,RAG或将成为下一代AI系统的核心架构之一。

2025-04-01 23:28:09 691

原创 2025年3月份我放弃了前端,转行了!!!猜我得到了什么?_前端转行不干互联网了

![为什么离开这个行业这个问题其实 我真的真的想了很多很多,我也分享给你们我的想法,希望可以帮助想继续深耕这个行业的继续深耕,犹豫想转行的帮助你们确定转行。综上考虑,我个人直接决定离开前端,因为这4个,都让我觉得在前端深耕会更好。但往往对于我最好的,却让我无法走出下一步,我挣扎,焦虑,走不出自己的舒适圈。害怕未知事物,这一切,都让我忘记了,我20年去上海找工作的日子,那时候蠢蠢的,呆呆的,啥也不会,靠着几个面试题,东奔西走,到处面试。失败远远大于成功,但我敢于去做。现在呢,面对前端行业,乃至于整体行业的经济

2025-03-27 23:03:57 373

原创 一文读懂「Lang Chain」_langchain

LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。官方文档:https://python.langchain.com/en/latest/中文文档:https://www.langchain.com.cn/

2025-03-27 23:02:04 844

原创 2024大模型安全实践白皮书|附42页PDF文件下载

本报告在分析了大模型发展趋势挑战的基础上,提出了大模型安全实践总体框架,并从安全性、可靠性、可控性以及评测四个角度对大模型安全技术进行了深度剖析。最后,在大模型安全未来发展趋势基础上,提出了大模型安全“五维一体”治理框架,对于大模型安全生态形成、大模型可持续发展具有非常重要和积极的意义。

2025-03-25 22:20:34 342

原创 全景解读 LLM Posting-Train(后训练)技术

2023 年,当 ChatGPT 惊艳世界时,很多人第一次意识到:原来 AI 不仅能背课文,还能写代码、编故事、解数学题。(Pretraining)和预训练阶段通过海量文本数据(通常达到 TB 级别)的自我监督学习,使模型掌握基本的语言规律和世界知识。但仅有预训练的LLM,就好像刚学会六脉神剑的段誉,一身内功,但不会施展。这时,我们就需要通过「后训练」来给模型能力进行「塑型」—— 通过特定方法让模型在医疗诊断、法律咨询、编程开发等专业领域大显身手,同时学会遵守伦理规范、避免信口开河。

2025-03-23 00:00:10 1024

原创 浙江大学强势出品!《大模型基础》教材已开源!附PDF文档_大模型基础pdf

这本浙大出品的大模型基础入门书籍:《大模型基础》你绝对不能错过!本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章,深入探讨了大模型的工作原理和使用方法-一提示工程,并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用,以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例,无论您是技术领域的专业人士,还是对新兴技术充满好奇心的读者,希望本书能激发您的思考,并为您展示一个崭新的创作世界。

2025-03-21 10:48:41 409

原创 手把手教你用Docker部署Dify平台,打造可视化LLM应用环境_dify docker部署

Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务(Backend as Service)和LLM Ops的理念,使开发者可以快速搭建生产级的生成式AI应用。即使你是非技术人员,也能参与到AI应用的定义和数据运营过程中。Dify内置了构建LLM应用所需的关键技术栈,包括对数百个模型的支持、直观的Prompt编排界面、高质量的RAG引擎、稳健的Agent框架、灵活的流程编排,并同时提供了一套易用的界面和API。这为开发者节省了许多重复造轮子的时间,使其可以专注在创新和业务需求上。”

2025-03-21 10:47:30 972 1

原创 2025大模型算法入行&转行?我建议你这样做!

当然有很多大佬他们全方位的强,比如我看到guidance、exllama这些一两个人开发的库,作者对数学原理的熟悉、以及极强的工程实现、性能优化能力让人叹为观止,让人心向往之,但是我又不是活不到明年了,也未必就不能至吧。剩下的人做的事情我觉得都不是那么有意义,不是说洗数据啥的不重要,重要,但对大多数人来说,对个人价值提升不大。其实除了上面说这些,还存在一些其他的方向,比如类似guidance这样在align模型之后的,和推理框架绑定比较强的组件,我觉得以后应该会融入到推理框架的范围内。

2025-03-17 23:47:54 1105

原创 大模型本地部署教程 | 搭建本地AI问答系统_embeddingstore

大家好,因为对AI大模型很感兴趣,相信很多兄弟们跟我一样,所以最近花时间了解了一些,有一些总结,分享给大家,希望对各位有所帮助。本文将讲解如何在本地搭建一个简易的AI问答系统,主要用java来实现,也有一些简单的python知识;网上很多例子都是以 ChatGPT来讲解的,但因为它对国内访问有限制,OpeAi连接太麻烦,又要虚拟账号注册账号啥的,第一步就劝退了,所以选择了 llama和qwen替代,但是原理都是一样的。

2025-03-17 23:44:19 941

原创 2025年2月份我放弃了前端,转行了!!!猜我得到了什么?

为什么离开这个行业这个问题其实 我真的真的想了很多很多,我也分享给你们我的想法,希望可以帮助想继续深耕这个行业的继续深耕,犹豫想转行的帮助你们确定转行。我能干什么? 这么一想,我觉得除了前端我好像什么都不会,吃不了苦,进不了厂,当不了服务员,送外卖又觉得这么年轻就要送外卖吗?干自媒体,可是觉得自己的生活好平淡。想来想去还是前端, 我已经快四年经验了,虽然只是专科,但还是优势哈。

2025-03-14 22:24:45 1075

原创 企业落地 AI 大模型,一个 DeepSeek 远远不够

本文整理自 InfoQ 策划的 DeepSeek 系列直播第九期节目。在直播中,极客邦科技创始人 &CEO 霍太稳对话神州数码集团首席 AI 专家谢国斌,深入探讨了 DeepSeek 爆火背后,AI 竞争格局将发生哪些变化,以及在新的格局下,AI 企业会面临哪些新的机会和挑战,企业又该如何抓住这些机遇。谢国斌表示,随着 AI 接入门槛和成本的降低,金融、医疗、教育和汽车等行业的应用可能会率先爆发。除此之外,制造业、办公行业等也有很大的发展空间。

2025-03-14 22:20:45 812

原创 缺人!高薪!今年春招最热职业AI大模型,大厂争夺AI大模型人才,年薪最高120万元

2025年以来,人工智能持续高热。随着2025年春招拉开帷幕,人工智能成为最热专业方向,供需缺口明显。各大用人单位“扩招”人工智能岗,应届毕业生的选择面变广。为了招揽优秀人才,用人单位提高薪酬待遇,甚至提前布局,为网罗2026届毕业生努力。

2025-03-11 20:59:30 3738

原创 AI医疗大模型:医疗行业的智能化解决方案

在科技飞速发展的今天,AI 医疗大模型正以前所未有的态势重塑医疗行业格局。这些智能模型宛如拥有超凡智慧的医疗助手,在疾病诊断、治疗方案制定、医学研究等诸多关键领域大显身手,为解决医疗难题、提升医疗效率与质量带来了全新的希望与路径。接下来,让我们一同深入探寻几款极具代表性的 AI 医疗大模型。华佗 GPT 作为港中大(深圳)在医疗健康领域推出的大模型,于 2023 年 2 月横空出世,成为国内首个类 ChatGPT 的医疗大模型。

2025-03-11 20:50:39 1178

原创 [建议收藏]LLM-Universe —小白也能上手的AI大模型开发学习教程:帮你快速入门大模型

在人工智能(AI)大模型席卷全球的今天,如何快速入门大模型开发成了许多初学者和开发者的心头难题。今天给大家推荐一个专为小白设计的学习大模型开发的开源项目——LLM-Universe,它由Datawhale团队打造。这个项目以“动手学大模型应用开发”为口号,旨在帮助零基础的开发者通过实践掌握大模型开发技能。让我们一起来看看它的魅力吧!

2025-03-10 23:44:52 438

原创 一文讲明白初学者怎么入门大语言模型(LLM)?从基础到扩展,超级适合新手入门!

关于如何入门LLM,大多数回答都提到了调用API、训练微调和应用。但是大模型更新迭代太快,这个月发布的大模型打榜成功,仅仅过了一个月就被其他模型超越。训练微调也已经不是难事,有大量开源的微调框架(llamafactory、firefly等),你只要懂部署,配置几个参数就能启动训练。甚至现在有大量云上项目,你根本不需要部署,直接上传数据,就能启动。

2025-03-10 23:40:45 753

原创 2025年中国AI大模型架构深度解读:从理论到应用的全面探索_通义千问大模型架构

商汤领先发布“日日新 SenseNova”大模型体系,提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种大模型以及能力,结合决策智能大模型,为 AGI 实现提供重要起点。除语言大模型“商 量 SenseChat”外,“如 影SenseAvatar”、“琼宇 SenseSpace”、“格物SenseThings”、“秒画 SenseMirage”一系列生成式 AI 模型,能够在文生图创作、2D/3D数字人生成、大场景/小物体生成实现应用。

2025-03-05 23:32:29 1289

原创 零基础入门AI大模型开发必读书籍(非常详细),2025AI大模型开发入门,收藏这一篇就够了!

本文即将推荐几本适合AI大模型开发的书籍,这些书籍涵盖了从基础理论到实际操作的各个方面。不论你是刚刚入门的初学者,还是希望深入了解并应用AI大模型的开发者,这些书籍都将为你提供宝贵的知识与实用的技巧,助你在这个快速发展的领域中取得突破。乘风破浪。1 《基于GPT-3,ChatGPT,GPT-4等Transformer架构的自然语言处理》主要内容了解用于解决复杂语言问题的新技术。将GPT-3与T5、GPT-2和基于BERT的Transformer的结果进行对比。

2025-03-05 23:28:27 931

原创 一文读懂AI Agents:让大模型拥有行动力(基础篇)

“从2024年底,各大头部LLM 公司开始逐步发布 AI Agent产品,最新的如 xAI发布的基于 Grok3 的 Deepsearch;OpenAI发布的DeepReseach;Perplexity的Deepsesearh。后面会深度解析以上各产品,在此之前,我们先再从基础理解下什么是 AI agent,基本概念,key components,基本的方法等 ”

2025-03-03 23:49:25 669

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除