自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(694)
  • 收藏
  • 关注

原创 程序员转行ai是否可行?

程序员转行AI是完全可行的。实际上,程序员具备了许多与AI相关的技能和知识,这为他们转行到AI领域打下了坚实的基础。首先,程序员已经具备了计算机科学和编程的知识。他们熟悉不同的编程语言和算法,这些对于理解和实现AI算法非常重要。此外,他们在处理数据和解决技术问题方面也具有一定的经验,这是AI开发过程中不可或缺的技能。

2025-05-16 13:20:33 544

原创 科普大模型入门指南:定义、应用与训练方法

在当今人工智能的浪潮中,大语言模型(Large Language Models, LLMs)正在改变我们与技术互动的方式。这些复杂的模型不仅具备理解和生成自然语言的能力,还在医疗、金融、教育等众多领域展现出强大的应用潜力。然而,尽管它们在推动技术前沿方面发挥着重要作用,关于大模型的本质、训练机制和控制策略仍然存在许多未知。

2025-05-14 17:19:47 817

原创 火爆全网!《LLM书》.PDF

本书是一本实用的生成式人工智能指南,重点介绍转换器和扩散模型。它涵盖了生成式人工智能项目的生命周期,包括用例定义、模型选择、微调和部署。

2025-05-14 17:12:20 425

原创 Qwen3技术报告英中对照版.pdf

Qwen3 是 Qwen 模型家族的最新版本,它在性能、效率和多语言能力方面都取得了显著进步。该模型系列包含从 0.6B 到 235B 参数规模不等的多种模型,包括密集型和专家混合型(MoE)架构,旨在满足不同下游应用的需求。

2025-05-14 16:49:51 876

原创 【2025最新】大模型学习路线:这会是你见过最全最新的大模型学习路线_大语言模型 强化学习 技术路线

大模型学习路线建议先从主流的Llama开始,然后选用中文的Qwen/Baichuan/ChatGLM,先快速上手体验prompt工程,然后再学习其架构,跑微调脚本

2025-05-13 17:57:37 939

原创 2025最新大模型技术学习过程梳理

学习大模型技术也有几个月的时间了,之前的学习一直是东一榔头,西一棒槌,这学一点那学一点,虽然弄的乱七八糟,但对大模型技术也算有了一个初步的认识。因此,今天就来整体梳理一下大模型技术的框架,争取从大模型所涉及的理论,技术,应用等多个方面对大模型进行梳理。

2025-05-13 16:12:44 612

原创 一个非常适合初学者来理解的大模型项目—《从零实现LLama3模型》

还不知道学大模型的有救了!发现一个非常适合初学者来理解大模型的项目,叫做从头开始实现LLama3。

2025-05-09 14:22:28 256

原创 哈工深发布多模态Reasoning大模型综述:感知、推理、思考和规划

如今的模型早已超越“看图说话”,论文开篇指出:真正的智能需要融合视觉、语言、听觉等多维度信息。就像人类遇到问题时会结合所见所闻,模型也需要跨模态推理能力,比如看到“乌云密布”联想到“带伞”,听到“玻璃碎裂”判断可能发生意外。 论文提出,多模态推理模型(LMRMs)是通向通用人工智能(AGI)的核心路径,但现有技术仍面临三大瓶颈:

2025-05-09 14:21:10 818

原创 零基础人员如何入门AI?这是一份给你的学习路径指南(非常详细)零基础入门到精通,收藏这一篇就够了_零基础如何快速了解ai

AI已成趋势,这点自不必多言。如今网络上的AI课程可谓五花八门形形色色,让人眼花缭乱难辨真假。其实细究下来,不少都是通过贩卖焦虑吸引对AI一知半解的普通人报课。有感于此,我想给零基础的你,介绍一下入门AI路径指南。在介绍关于AI,零基础的你,可能还有以下这些常见的误解:(误)使用AI需要懂代码懂技术,是只有程序员才能使用的高科技。——(正)当前许多AI应用和服务使用门槛很低,无需编程知识即可使用,用户只需按照提示操作即可。

2025-05-07 21:57:23 1000

原创 【万字详解】手把手带你一步步搭建RAGFlow(超干货)_ragflow安装教程

本篇给大家介绍一下RAGFlow的本地搭建,以下过程基于Ubuntu24,其它Linux系统的搭建方法也基本相同。先来温补一下,RAGFlow是一个基于对文档深入理解的开源 RAG(检索增强生成)引擎。它的作用是可以让用户创建自有知识库,根据设定的参数对知识库中的文件进行切块处理,用户向大模型提问时,RAGFlow先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成答案输出。它能凭借引用知识库中各种复杂格式的数据为后盾,为用户提供真实可信,少幻觉的答案。

2025-05-07 21:55:23 767

原创 聊一聊国内大模型公司,面试心得和感受

这段时间面试了很多家,也学到了超级多东西。楼主这边背景是做基座预训练算法端为主的,对框架端和RL的内容有一定了解(面试能凑合),对于后端的知识比如ML compiler,kernel,cuda相关的了解就比较浅了(问到觉大概率挂)。硬件几乎不太懂。大模型这方向真的卷,面试时好多新模型,新paper疯狂出,东西出的比我读的快。Research岗位对工程也有要求,工程端也需要了解模型。感觉比较硬核的岗位,尤其初创公司都是对好几个点都有要求的(应用,模型,框架,底层后端,硬件)。

2025-04-23 22:54:40 1031

原创 RAG+AI工作流+Agent:LLM框架该如何选择,全面对比MaxKB、Dify、FastGPT、RagFlow等

MaxKB = Max Knowledge Base,是一款基于 LLM 大语言模型的开源知识库问答系统,旨在成为企业的最强大脑。它能够帮助企业高效地管理知识,并提供智能问答功能。想象一下,你有一个虚拟助手,可以回答各种关于公司内部知识的问题,无论是政策、流程,还是技术文档,MaxKB 都能快速准确地给出答案:比如公司内网如何访问、如何提交视觉设计需求等等

2025-04-23 22:43:10 1095

原创 学LLM建议:大家有空可以去小破站学大模型❗

无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-04-16 23:03:11 667

原创 关于2025年人工智能agent的5个预测_ai agent 预测

2024年是人工智能agent走向主流的一年。从年初黑客们那些笨拙、昂贵且充满激情的项目开始,agent现在已经得到了科技巨头、SaaS公司、学术研究人员等更多人的接纳。与此同时,他们的形式也在不断增多,从文本扩展到多种模式,并在现实世界中执行行动的能力也变得更强大。在这里,我预测2025年agent领域的轨迹,因为它开始在人工智能社区之外产生影响力。1. 对agent的兴趣持续激增今年,对人工智能agent的兴趣爆发式增长,谷歌搜索量增加了十倍。

2025-04-16 22:58:03 869

原创 年薪五十万起,大模型公司偏爱哪种毕业生,企业对人才的需求自然已经水涨船高

自从OpenAI打开了生成式AI的潘多拉魔盒,大模型依然是2024年最炙手可热的风口,硅谷作为技术发源地,人才蜂拥。任何优秀的组织,一定都是找到了一种方法和对应的工具,去最大程度地激发每一个个体的创造力。但更重要的,是抓住那些稍纵即逝的天才灵感。《AI光年》通过走访一些AI公司员工,记录当下中外大模型公司的变化:掌握未来的人才在哪里?是为第一篇。1998年出生的林菲,成了AI风口下第一批就业的年轻人。林菲是今年毕业的计算机专业硕士。

2025-04-11 22:43:14 711

原创 传统预训练正走向终结,推理优化与后训练提升有限,大模型今后如何突破发展瓶颈?

主动构建多任务样本,实现数据生成与学习闭环。无需大规模人工标注,即可高效扩展预训练数据,根本性缓解当前高质量多模态数据稀缺的问题。

2025-04-11 22:32:43 1015

原创 我真的花了很久,才理清大模型到底该怎么学!

说句实在的,很多人以为学大模型就是搞点提示词、调个 API,就能搞定一切。但真想“弄懂它”,甚至“做出点东西”来,不啃几本靠谱的书,真的不行。我一开始也是刷了一堆教程,收藏了几十个 AI 工具帖,但一到自己动手就抓瞎。直到我静下心认真啃完这些书,才发现——原来很多问题,书里早就帮你解答了。

2025-04-08 18:25:47 620

原创 知识图谱+知识库RAG项目Yuxi-Know及大模型推理内部可视化工具OpenMAV实现拆解

之前有比如Bertvis项目,对每一层的推理进行可视化,所以类似的工具轮子也越来越多,如最近又多了个可视化大模型内部运作的开源工具OpenMAV(),基于Python的工具,旨在在文本生成过程中实时可视化大语言模型(LLM)的内部工作原理。该工具通过交互式的基于终端的界面,为用户提供对模型内部结构的洞察。通过交互式终端界面,可实时可视化LLM在生成文本时的内部状态,包括注意力分布、MLP激活值和Token预测概率等,可通过插件轻松扩展可视化功能,并支持多种模型,如 GPT-2、Llama等。

2025-04-08 18:21:37 741

原创 世界级AI大佬吴恩达著作:LLM CookBook 汉化版 本教程

🚀本教程面向入门 LLM 的开发者,深入浅出地介绍了对于开发者,如何构造Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能,是入门 LLM 开发的经典教程;

2025-04-01 23:23:33 742

原创 图解大模型训练之:数据并行(DP、DDP、ZeRO、零冗余优化)

1、在DP中,每个GPU上都拷贝一份完整的模型,每个GPU上处理batch的一部分数据,所有GPU算出来的梯度进行累加后,再传回各GPU用于更新参数2、DP多采用参数服务器这一编程框架,一般由若个计算Worker和1个梯度聚合Server组成。Server与每个Worker通讯,Worker间并不通讯。因此Server承担了系统所有的通讯压力。基于此DP常用于单机多卡场景。3、异步梯度更新是提升计算通讯比的一种方法,延迟更新的步数大小决定了模型的收敛速度。

2025-04-01 23:19:24 751

原创 程序员末日?AI大模型已替代45%岗位!2025年自救指南速看

无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-04-01 23:16:34 1204

原创 做完RAG图片搜索后,才明白过去对RAG的理解完全不够

简单来说,图片RAG是一种将图像检索与生成模型结合的技术。它的核心思想是:先从海量数据中检索出与用户输入最相关的图像或信息,再将这些检索结果作为上下文,输入到生成模型中,输出高质量的响应。

2025-03-27 23:14:27 982

原创 【2024医疗人工智能报告】|《2024年医疗人工智能研究报告-生成式AI爆发,医疗人工智能走到新的十字路口》||(附下PDF)_2024医疗健康ai大模型行业研究报告

导读《2024年医疗人工智能研究报告》由蛋壳研究院发布,深入探讨了医疗人工智能在2024年的发展现状与未来趋势。报告指出,随着大语言模型和生成式AI技术的快速发展,医疗领域的多个场景如互联网医疗、医学影像、新药研发等正经历重塑,释放出前所未有的价值。然而,同时强调,在融资形势严峻的背景下,医疗AI企业必须全面考量场景、技术、风控、商业化等多方面因素,以实现决策的精准性。研究核心聚焦于“场景”与“产品”,通过分析医院、药企、械企的供需逻辑和实战案例,为AI企业在布局、选品、研发、商业化方面提供参考建议。

2025-03-27 23:06:35 477

原创 厦大团队:DeepSeek大模型及其企业应用实践(150页PPT,企业人员的大模型宝典)

12025年春节期间,DeepSeek的发布震撼全球,标志着人工智能大模型进入“普惠”时代,大模型开始深刻影响我们工作和生活的方方面面。每个人都有必要学习、了解和使用大模型。你是否渴望揭开大模型的神秘面纱?厦大团队带着满满诚意,重磅推出 4 个大模型科普报告!面向社会大众,我们用 140 页 PPT 深入浅出地讲解大模型概念、技术与应用实践,让每个人都能轻松读懂大模型。对高校而言,120页PPT深度剖析 DeepSeek 大模型如何赋能教学与科研,为学术创新注入新动力。

2025-03-25 22:12:42 369

原创 抖音电商如何用 Agent 重做智能客服?一键获取同款!

在传统电商客服体系中,服务流程通常由智能客服系统与人工客服团队协同完成,并衍生出一系列前后端的配套服务。尽管大模型已经诞生近两年半,目前 AI 客服大都还停留在 SOP 辅助模式或 Copilot 协作模式。“不配置就回复不了”、“机械式单轮问答”、“幻觉问题误导客户”、“无法识别判读意图,答非所问”等问题仍然普遍存在。为了让 AI 客服更智能化,,在 AI 客服场景构建了人机协作的新型服务范式。当前主流智能客服系统通常采用的服务流程为:用户自主查询→机器人应答→转接人工。

2025-03-25 22:03:24 1127

原创 2025年最火技术岗来袭:大模型应用开发工程师,你准备好了吗?

无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2025-03-23 00:02:25 942

原创 一文彻底搞懂大模型-RAG

一、 检索增强生成(RAG)什么是RAG?RAG(Retrieval-Augmented Generation,检索增强生成),RAG是一种 AI 框架,它将传统信息检索系统(例如数据库)的优势与生成式大语言模型 (LLM) 的功能结合在一起。LLM通过将这些额外的知识与自己的语言技能相结合,可以撰写更准确、更具时效性且更贴合具体需求的文字。什么是RAG?如何理解RAG? 通过上一个问题,我们知道了什么是RAG?了解到RAG是一种结合了信息检索、文本增强和文本生成的自然语言处理(NLP)的技术。RAG的目的

2025-03-21 10:52:40 1132

原创 大模型电子书学习推荐 |6本大模型书籍(附pdf版),看完少走一半弯路

自学大模型这6本书你一定要看,学完你就是大模型大师了

2025-03-21 10:45:39 959

原创 小白也能微调大模型:LLaMA-Factory使用心得_llama factory

大模型火了之后,相信不少人都在尝试将预训练大模型应用到自己的场景上,希望得到一个垂类专家,而不是通用大模型。目前的思路,一是RAG(retrieval augmented generation),在模型的输入prompt中加入尽可能多的“目标领域”的相关知识,引导模型在生成时尽量靠拢目标领域,运用prompt中给予的目标知识;二是有监督微调,用适量的专业领域的数据(或混通用语料)让模型更能生成目标场景的内容。本文主要讲的就是微调。

2025-03-17 23:52:12 1023

原创 2025大模型时代已至,产品经理如何紧跟时代步伐?

在数字化浪潮的推动下,人工智能领域正迎来一场技术革命,而大模型技术的崛起无疑是这场革命中的明星。作为产品经理,我们不仅要洞察市场趋势,更要紧跟技术发展,以创新的思维和敏锐的洞察力,引领产品走向未来。本文将探讨大模型技术的市场现状,以及产品经理如何入行大模型,共同开创智能新时代。大模型技术的崛起为产品经理提供了巨大的机遇和挑战。作为产品经理,我们要紧跟时代步伐,深入了解大模型技术,洞察市场需求,打造创新产品,并组建专业团队支持产品的研发和迭代。只有这样,我们才能在这个充满机遇和挑战的时代中立足并取得成功。

2025-03-17 23:50:36 814

原创 在自然语言处理(NLP)任务中,怎么处理数据——即怎么把文字输入到模型中进行处理?

文本序列化是自然语言处理任务的前置条件,而文本序列化需要经过分词,构建词汇表和序列化的几个步骤**”**在神经网络或者说在机器学习领域中,数据主要以向量的形式存在,表现形式为多维矩阵;但怎么把现实世界中的数据输入到神经网络中是机器学习的一个前提。但我们也知道,计算机只认识数字,而不认识文字和图片;因此,就需要把这些数据转换为计算机能够识别的格式;而在神经网络模型中就是怎么把这些数据转换为向量的格式。简单来说,就是把现实世界中的数据转化为用多维矩阵进行表示的过程。

2025-03-14 22:34:57 928

原创 2025大模型算法方,实习会经常提问哪些问题? ?_大模型算法面试要刷算法题吗

现互联网研发一枚,曾拿过多个算法/研发岗SP offer,简要介绍一下大模型算法岗面试内容和如何准备面试。大模型算法岗的面试内容,实际上可以拆解成两部分,一是算法岗通用的面试内容,二是大模型专有相关部分。算法岗通用面试内容这部分内容很重要,因为通用的面试内容可以适用于不同的研发岗,包括算法、后端开发、数据开发等等,可以“一稿多用”;此外这部分基础掌握的好,也能给面试官留下基础扎实、高潜力的印象。通用的面试内容,通常分为个人经历介绍、手撕代码、原理考察、创新性问题几部分。

2025-03-14 22:30:07 1175

原创 大模型部署全攻略!手把手教你部署开源 DeepSeek,告别访问受限困扰!

大模型正在重塑我们的学习和工作方式,不管你是选择使用 DeepSeek 还是自己部署大模型,最重要的是。近年来,大模型技术突飞猛进,全球各大科技公司纷纷投入研发,形成了一系列成熟的主流大模型。以下是目前国内外最具代表性的大模型:

2025-03-11 21:10:51 1086

原创 风口出现!我国AI人才缺口达500万人

它打破了以往 AI 在功能和应用场景上的局限,具有跨领域协同的能力,能够在多个领域发挥作用,从办公场景中的文档处理、数据分析,到教育领域的教学辅助、个性化学习方案制定,再到金融领域的股票分析、投资策略制定等,都不在话下,堪称人们工作与生活中的得力 “数字助手”。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。

2025-03-11 21:02:35 1149

原创 揭露大模型本质,2025大模型入门必看的12本书!看完我直接跪了_大模型学习书籍推荐

随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书希望向读者提供学习AI技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,给大家指出AI赋能过程中需要避免的“坑”,期待我们在AI时代共同发展自己、发展生活,在未来遇到更好的AI产品、更好的自己。

2025-03-10 14:09:11 804

原创 LaRA: RAG与长上下文LLM到底哪个更好

通过对七种开源和四种专有LLMs的系统性评估,我们发现RAG与LC之间的最优选择取决于模型参数规模、长文本处理能力、上下文长度、任务类型及检索片段特征等多重因素的复杂交互。我们的研究发现为实践者提供了切实可行的指导,助其在开发和部署LLM应用时有效利用RAG与LC方法。

2025-03-10 13:52:51 980

原创 DeepSeek带火AI大模型岗!急招岗年薪百万,人才缺口将达400万(附大模型教程)

正值年后跳槽高峰期,近期大火的国产AI大模型——DeepSeek发布的一系列高薪招聘信息在各大平台刷屏,阅读量上亿。微博热搜看来,今年春节期间DeepSeek的横空出世,不仅点燃了资本市场,更是引爆了AI人才市场。阿里的钉钉软件、华为的AI平台接连官宣全面接入DeepSeek系列模型,更有业内人士预测,未来五年,AI人才缺口将高达400万!互联网红利逐渐消退,AI领域立刻接棒,开启新一轮“造富神话”。根据脉脉发布的《2024年度人才迁徙报告》显示,《2024年度人才迁徙报告》部分内容。

2025-03-05 23:49:05 1033

原创 利用langchain-ChatGLM、langchain-TigerBot实现基于本地知识库的问答应用_langchain 本地知识库

刷B站的时候,无意中看到吴恩达的一个langchain的教程,然后去github上搜了下,发现别人利用langchain和chatGLM做的基于本地知识库的问答应用挺好的,学习下,同时增加了利用langchain-TigerBot实现的本地知识库。

2025-03-05 23:40:47 692

原创 浙江大学|153页《DeepSeek行业应用案例集》也来啦,DeepSeek居然已渗透到千行百业如此之深!(附下载方法)

《DeepSeek行业应用案例集:解锁智能变革密码》由浙江大学信息技术中心发布,全面展示了DeepSeek人工智能技术在农业、制造业、金融、医疗、教育等领域的创新实践。本案例集通过40多个行业应用实例,揭示了DeepSeek如何以数据驱动和智能化解决方案推动行业转型升级,为从业者提供前沿技术落地的参考范本。

2025-03-03 13:36:35 1889

原创 一文梳理有效提升RAG效果的方法

在大模型实际落地的时候,存在一些问题,主要集中在以下方面:缺少垂直领域知识:虽然大模型压缩了大量的人类知识,但在垂直场景上明显存在短板,需要专业化的服务去解决特定问题。存在幻觉、应用有一定门槛:在大模型使用上有一些幻觉、合规问题,没有办法很好地落地,配套工作不足,缺乏现成的方案来管理非结构化文本、进行测试、运营和管理等。存在重复建设:各业务孤立摸索,资产无法沉淀,存在低水平重复建设,对公司来说ROI低,不够高效。

2025-03-03 13:06:54 727

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除