自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1175)
  • 收藏
  • 关注

原创 100道高频大模型面试题,看我是如何手撕面试官 脚踢hr

提供一百道面试题并保证每一道题目的详细解答达到一千字是不太现实的,因为这将会是一个非常庞大的文档。不过,我可以为你提供一系列精心挑选的大模型相关面试题目,并简要说明每个问题的重点和考察方向,这样可以帮助你准备面试。大模型面试题集总结以上这些面试题目涵盖了从基础概念到高级技术的各个方面,对于准备大模型相关职位的面试非常有帮助。建议在准备过程中,不仅要熟悉这些问题的答案,还要尝试自己动手实践,这样才能真正掌握所学知识。希望这份面试题集能帮助你在面试中脱颖而出!

2024-08-16 16:06:29 1577

原创 跨越边界:我在转型AI产品经理的一年里所积累的成长与感悟

不知不觉,已经挂着AI产品经理的title过了一年多,盘点后竟然发现,这一年中居然从0到1做了4款AI应用产品,涉及内容、营销销售、私域运营等方向,忙碌而充实。今天就结合自己这一年多的AI转型实践,和大家分享下我关于AI产品经理的一些总结和思考。在这一年多的转型旅程中,我从一名传统产品经理成长为AI产品经理,这个过程充满了挑战与收获:知识体系的重构我系统地学习了机器学习、深度学习、自然语言处理等AI基础课程,弥补了技术知识的空白。

2024-08-02 18:07:37 2202

原创 深入探究文档解析技术,助力大模型训练与应用的创新发展

探索文档解析技术是推动大模型训练与应用的重要一环。随着信息的爆炸式增长,文档数据成为了重要的数据来源之一,这些数据以多种形式存在,包括结构化数据、非结构化文本和图像等。因此,有效地解析和理解这些文档数据对于提升大模型性能与拓展大模型应用至关重要。在此背景下,大模型训练与应用需要依赖先进的文档解析技术来处理复杂的文档数据。

2024-07-19 11:41:07 2089

原创 初识LangChain的快速入门指南

LangServe可以帮助开发人员将LangChain应用程序部署为REST API。使用LangChain时不是必定使用LangServe。安装langserve。

2024-06-29 20:56:14 1757

原创 从零开始认识大模型,入行必读!

大模型,顾名思义,就是具有庞大参数和复杂结构的机器学习模型。它能够处理海量的数据,从中提取出有价值的信息,为我们提供决策支持。与传统的机器学习模型相比,大模型具有更高的准确性、更强的泛化能力和更广泛的应用场景。

2024-06-24 13:47:24 2152

原创 【大模型入门教程】大模型入门课程:从零基础到精通,一篇详细的收藏指南

ChatGPT的推出标志着生成式AI的奇点来临,其出色的自然语言处理能力和多模态扩展展现了通用人工智能的希望。尽管短期内应用变现有限,但大模型技术持续加速迭代,视频/音频生成等突破不断涌现。语言理解作为智能核心,使大语言模型展现出强大的"涌现能力"——未经专门训练即可完成多种任务。这种技术潜力正推动全球AI市场向万亿规模发展,预示着我们距离AGI的实现仅剩数年之遥。

2025-06-03 14:45:37 439

原创 AI大模型学习必备:必逛的十大顶级网站推荐,非常详细,值得收藏!

本文推荐了5个学习AI大模型的优质网站:Coursera提供斯坦福等名校的AI课程;edX汇集MIT、哈佛等顶尖大学的机器学习课程;Kaggle通过数据竞赛提升实践能力;Hugging Face专注NLP,提供大量预训练模型资源;此外还有提供在线AI课程的Udacity(未完整列出)。这些平台涵盖理论学习与实践应用,是掌握AI大模型技术的重要资源。

2025-06-03 14:40:28 629

原创 【大模型入门必看】RAGEN:深入解析通过多轮RL强化学习实现LLM Agent的自我进化

最新研究发现,多轮强化学习(RL)在训练大型语言模型(LLM)智能体时存在严重缺陷。斯坦福大学等机构的研究表明,智能体在自我对话和修正过程中易陷入"回声陷阱"(EchoTrap),导致策略退化和表现崩塌。论文提出的StarPO框架和RAGEN系统揭示,智能体RL训练存在三大问题:1)梯度不稳定,2)同质化反馈引发自我确认偏差,3)推理能力随训练衰减。为解决这些问题,研究者提出StarPO-S改进方案,通过轨迹过滤和不对称裁剪等技术提高稳定性。

2025-06-03 14:35:42 447

原创 2025大模型学习路线图:附学习资源分享,非常详细,助你快速掌握大模型

是我们对大模型提出的问题。举一个最简单的例子,很多同学在第一次使用AI时,都会问AI"你是谁","你是谁"这个问题便是prompt。一个清晰有效的prompt包含角色、任务目标、上下文、输出要求、限定条件、理想示例等一系列内容,只有把prompt设计好了,大模型才有可能发挥出理想的效果。

2025-06-03 14:30:15 499

原创 手把手实操LoRA高效微调:定制垂直行业深度大模型,实现真正懂会用

本文介绍了如何通过微调通用大模型使其具备特定任务能力的方法,以提升数学解题能力为例。首先解释了模型微调的基本原理,包括参数调整、梯度下降等关键概念。接着详细展示了任务实现过程:下载1.5B参数的Qwen2.5模型,准备1000+题目训练集,进行多轮参数优化(调整学习率、训练次数等),最终将10道测试题的得分从30分提升至70分。文章还分析了未满分的原因,并提供了完整的大模型学习路径,涵盖系统设计、提示词工程到行业应用等七个阶段,最后附赠丰富的学习资源获取方式。

2025-06-03 14:25:40 622

原创 AGI大模型学习路线(非常详细)收藏这一篇就够了!_AGI大模型学习路线

学习大模型的路线建议:首先夯实数学基础,重点掌握线性代数(矩阵运算、特征值等)、微积分(导数、积分)和概率统计(概率分布、贝叶斯定理),推荐MIT和Khan Academy的课程;同时需具备Python编程能力,熟悉NumPy、PyTorch等库。其次学习深度学习基础理论,掌握神经网络、优化算法等核心概念,并动手实践经典模型。最后深入研究大模型相关技术,包括Transformer架构、预训练方法等,可通过Hugging Face库进行实践。整个学习过程需循序渐进,持续跟进最新研究成果。

2025-06-02 17:51:37 1350

原创 ScrapeGraphAI:基于LLM的智能爬虫,多页面爬取、语音生成,开启数据提取新纪元!

可以从新闻网站抓取文章,并使用LLM进行文本摘要,快速生成新闻综述或行业报告。这种功能可以帮助用户及时了解最新资讯,节省阅读时间。五、快速使用。

2025-06-02 17:49:20 535

原创 这个大模型岗位爆了:月薪4万+,二本也能冲!!!

张一鸣曾说:以大多数人努力程度之低,根本轮不到拼天赋。大家好,我是播妞。一直焦虑,从未行动。这就导致一个问题,看不到机会在哪里,叫嚣着时代红利已消失,只剩下“人口红利”。实际上,玩过游戏的都知道,但你要是代代版本玩盖伦,那肯定很难上大分的。找到真正的版本之子,稍微花点时间学会它,上分就是手拿把掐。找工作同样如此,别再面对AI浪潮视而不见:“AI就是未来10年的时代红利,也是你逆袭的最佳机会~什么是内卷?有句话说,当一个人练了葵花宝典,就能天下无敌。

2025-06-02 17:47:21 464

原创 【AI4TCM】基于GraphRAG技术赋能的大语言模型系统OpenTCM

OpenTCM通过。

2025-06-02 17:43:38 500

原创 信息量爆炸!“互联网女王”发布340页AI趋势报告

当地时间5月30日,玛丽·米克尔(Mary Meeker)发布了长达340页的“AI趋势报告”(完整版报告请下拉至文末获取)。报告显示,AI的发展速度前所未见,用户增长、使用量和资本支出均呈现出爆炸式增长,其影响力可能远超技术本身。玛丽·米克尔是美国风险投资家,曾就职于摩根士丹利和凯鹏华盈(Kleiner Perkins),于2018年创立了自己的风投公司邦德资本(BOND)。她主要专注于互联网与新技术领域投资,被誉为“互联网女王”。

2025-06-02 17:42:27 772

原创 Mamba核心作者新作:取代DeepSeek在用的注意力机制,专为推理打造

曾撼动Transformer统治地位的Mamba作者之一,刚刚带来新作——在保持模型性能不变的情况下,将解码速度和吞吐量最高提升2倍,大大优化了模型的长上下文推理能力。这项研究的三位作者均来自普林斯顿大学,论文主要有两大贡献:其一,提出Grouped-Tied Attention(GTA),与已集成到LLaMA 3的注意力机制GQA质量相当,但KV缓存用量减少约50%。

2025-06-02 17:40:58 511

原创 Trial Agent:一种基于创新智能大模型(LLM)的自主临床试验数据分析智能体 - 赛诺菲制药

Profile组件定义了Trial Agent在其指定领域(临床试验)中的角色和功能。通过引导提示,代理了解可能处理的文件和数据类型,从而在接收到用户问题时,能够选择合适的文件进行查询。

2025-06-02 17:39:35 889

原创 程序员转行大模型:抓住IT行业最后的风口,五大热门岗位推荐,非常详细收藏我这一篇就够!

大模型领域热门岗位包括:1. 模型研发工程师,负责深度学习模型架构设计与优化,需掌握PyTorch/TensorFlow框架;2. 算法工程师,专注算法实现与业务落地,要求扎实的机器学习基础;3. 数据科学家,运用大模型进行数据挖掘与分析,需精通数据处理工具。这些岗位适合具备数学基础、编程能力和研究精神的程序员转型,应用场景覆盖计算机视觉、自然语言处理、金融风控等多个领域。

2025-05-31 18:15:34 1128

原创 卷起来了?AI大模型求职真相:我们扒了数百份招聘JD,发现了这些秘密!

需求从单纯的模型研究向模型应用和智能体构建大规模迁移。能利用LLM解决实际问题、创造业务价值的岗位非常热门。纯粹的调参侠或只懂理论的算法工程师越来越难,市场需要既懂模型原理,又能动手写高质量代码、设计系统、完成部署和优化的复合型人才。强大的软件工程能力变得前所未有的重要。除了传统的机器学习/深度学习知识,RAG、Prompt Engineering、Fine-tuning、Agent框架 (LangChain/Dify等)、向量数据库等围绕LLM应用的技术栈需要重点学习和实践。

2025-05-31 18:10:59 600

原创 一文读懂,到底什么是大模型和智能体?

大模型(Large Model)指的是。

2025-05-31 18:09:20 738

原创 关于Agent在实际开发过程中遇到的问题记录

Agent智能体技术理论和实际操作完全是两码事,这也是为什么市场一直有人说还看不到大模型的应用价值。最近在做基于Agent的数据分析功能,主要使用大模型和工具来实现;通过大模型自主分析的能力获取数据的分析结果,然后调用工具来进行绘图;开发框架使用的是Langchain和Langgraph。但是本来以为是一个很简单的事情,但等到真正操作起来时才发现;其过程远比自己想象中的要复杂得多。果然是纸上得来终觉浅,绝知此事要躬行。Agent实际开发中存在的问题。

2025-05-31 18:07:55 731

原创 AI时代组织价值重塑指南:麦肯锡26页PDF报告深度剖析

本文提供完整版报告下载,请查看文后提示。......文│麦肯锡。

2025-05-31 18:06:38 270

原创 Tool-Star:赋予大模型结合多工具推理的能力

Tool-Star框架成功地赋予了大模型多工具调用的能力,解决了模型在知识密集型真实世界任务中和数学推理型任务的局限性。通过多种工具适时调用,Tool-Star使模型推理能够在多种任务上生成稳定输出。未来,为持续提升TIR推理模型的能力,仍有很多方向值得探索:•。

2025-05-31 18:02:37 599

原创 [医学顶刊JAMA]构建人工智能大模型赋能的未来医学院

这篇文章探讨了如何利用人工智能(AI),特别是大型语言模型(LLMs),来重塑未来的医学教育,以培养能够在AI时代蓬勃发展的医生。该问题的研究难点包括:如何有效地将AI工具整合到现代医学教育中,如何确保AI的使用与培养有能力、有同情心和适应性的医生的目标相一致,以及如何挑战LLMs进行复杂的临床案例推理。相关工作包括LLMs在临床任务中的初步成功应用,以及对其在逻辑推理方面的能力的质疑和研究。

2025-05-30 21:49:41 658

原创 【大模型入门必看】大语言模型详解:非常详细,一文带你深入理解其原理与应用!

本文基于谷歌云官方视频《Introduction to Large Language Models》,由ChatGPT4整理而成,系统介绍了大语言模型的基础知识与应用。主要内容包括:1)大语言模型的定义,作为深度学习的分支,通过海量文本训练实现语言理解与生成;2)模型的核心应用场景如对话系统、文本生成等;3)提示词调优的关键技术;4)谷歌Gen AI开发工具概览。文中通过技术架构图展示了机器学习、深度学习与大语言模型的层级关系,并以ChatGPT为例说明模型如何学习语言模式。

2025-05-30 11:23:25 939

原创 大模型终极指南:从入门到企业布局,保姆级教程,非常详细,一篇文章让你成为半个专家!

目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 , 大模型作为其中的重要组成部分 , 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力, 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 ,为各行各业带来了革命性的改变和机遇 。

2025-05-30 11:20:09 976

原创 【大模型保姆级教程】AI+办公革命:8大应用场景全面解析,从理论到实践赋能未来办公!

AI技术正深刻重塑企业办公模式,覆盖8大核心场景:智能文档处理(自动生成报告/合同审查)、智能演示制作(AI生成PPT/数据可视化)、智能数据分析(业务预测/风险管理)、智能会议协作(实时转录/多语言翻译)、流程自动化(财务/HR流程优化)、知识管理(智能搜索/专家定位)、办公环境优化(空间调度/节能调节)以及人力资源管理(人才评估/培训推荐)。典型应用显示效率提升达300%-800%,如合同审查时间从数小时缩短至分钟级。企业需分阶段实施AI转型,未来将向多模态融合、认知增强方向发展。

2025-05-30 11:16:31 668

原创 【AI大模型】新鲜出炉!一份热乎的大模型应用面经,助你斩获心仪offer!

1️⃣面试概况:近半年面过20+企业(阿里/腾讯/字节等),主要考察LLM应用实践能力。高频考点包括RAG技术(文档切割/多路召回)、Agent设计(记忆机制/反思优化)、Prompt工程(ReAct/CoT)等。微调经验成为加分项,算法题以DP为主,八股文占比下降。2️⃣关键发现:• 岗位集中在游戏AI助手、企业解决方案等场景• 薪资涨幅普遍20%以内,需合理预期• 效果量化能力比技术炫酷更重要

2025-05-30 11:10:33 822

原创 【大模型入门】DeepSeek强势进入千亿医疗市场:全球招募医学AI领域的’破壁者’,共同开创未来!

DeepSeek高调进军医疗AI领域,启动"数据百晓生"等专项招聘计划。该战略布局基于三大动因:1)技术积淀匹配医疗场景需求;2)中国AI医疗市场预计2033年达3157亿元;3)政策持续加码。招募计划覆盖11个核心岗位,包括医学数据专家、全科开发工程师等,最高年薪达150万,凸显对复合型人才的迫切需求。此举将重塑行业格局,但需突破数据孤岛、临床落地等挑战。医疗AI正从实验室走向产业化,有望带来诊疗效率革命性提升。

2025-05-30 11:03:52 835

原创 【大模入门】大模型训练秘籍:方法与技巧详解,掌握核心技术!非常详细,收藏我这一篇就够了!

本文介绍了四种主流的大模型并行训练方法:数据并行(DP/DDP)、模型张量并行(TP)、流水线并行(PP)和ZeRO数据并行,并分析了各自的特点和适用场景。数据并行通过分割数据实现同步训练;张量并行将模型参数切分到不同GPU;流水线并行按层拆分模型;ZeRO则通过参数分片节省显存。文章还对比了DP与DDP的差异,讨论了混合并行策略的选择依据,最后提供了针对不同硬件配置(单卡/多机多卡)的优化建议。文末附赠AI大模型学习资料包,包含学习路线、实战案例等资源。

2025-05-29 16:37:44 759

原创 【大模型入门必看】AI大模型学习路线图:零基础入门到精通,一篇详解,值得收藏!

入门AI大模型需从数学与编程基础入手。数学方面重点掌握线性代数(矩阵、特征值)、微积分(导数、多变量)和概率统计(贝叶斯定理),推荐MIT和Khan Academy课程。编程需精通Python(Codecademy/Coursera课程)及数据结构与算法(LeetCode练习)。打好基础后,可逐步深入机器学习框架与模型训练。系统性学习结合实践项目是掌握大模型技术的关键路径。

2025-05-29 16:32:58 567

原创 【大模型路线】DeepSeek-R1-0528低调炸场:小更新大飞跃,性能飙升,震撼发布!

DeepSeek在HuggingFace悄然开源新模型DeepSeek-R1-0528,虽官方称"小版本更新",但实测显示其能力显著提升:代码生成更精准、推理能力媲美Google模型、写作更自然流畅,并展现出独特的"内心独白"式思考。该模型在LiveCodeBench排名中超越Claude3.5Sonnet,仅次于OpenAI顶级模型。其突出特点包括处理30-60分钟复杂任务的能力,以及更人性化的表达风格。

2025-05-29 16:27:28 577

原创 【大模型入门必看】Manus AI智能体:AGI发展新范式实践与测评报告,89页详尽文件分享

人工智能正加速从专用工具向通用智能(AGI)演进,AI智能体(Agent)的出现标志着AI"自主执行任务"的关键突破。中国团队ManusAI通过模拟人机交互能力,推动AI从被动响应到主动执行的转变。报告显示:2025年大模型岗位缺口达47万,掌握AI技能可使薪资溢价34%,并详细拆解了90天四阶段学习路径(应用开发→知识增强→模型训练→商业部署),强调AI时代核心竞争力在于快速掌握智能工具的能力变革。

2025-05-29 16:24:22 454

原创 【大模型入门】重磅消息!DeepSeek R2发布时间备受瞩目

DeepSeekR2作为我国新一代AI大模型,预计2025年5月发布,其1.2万亿参数规模和HybridMoE3.0架构显著提升了性能与成本效益。依托华为Ascend910B芯片集群和清华算法创新,R2实现了技术自主可控,推理成本较GPT-4降低97.3%。该模型在多模态处理、代码生成等任务中表现突出,其开源计划或将重塑全球AI竞争格局。同时配套的大数据建模平台和AI学习资源,为开发者提供了从理论到应用的全套解决方案,展示了中国在AI领域的快速突破与生态布局。

2025-05-29 16:20:23 2107

原创 AIGC大模型面试经验汇总:全面细致,助你备战大模型面试!

大模型时代AI实习面试经验总结本文汇总了多家企业AI算法岗实习面试经历,涵盖字节、网易、好未来等公司。面试主要考察:技术基础:Transformer结构、位置编码、LLaMA等模型细节算法能力:平方根计算、岛屿数量等编程题项目经验:论文研究、推荐算法实习等深度提问行业认知:AIGC发展、RLHF技术等前沿话题不同企业侧重点各异:字节重技术深度,网易伏羲关注场景题,好未来聚焦大模型应用。面试建议:掌握核心模型原理,熟悉PyTorch框架,准备项目细节和行业趋势分析。当前大模型人才缺口大,系统学

2025-05-28 16:41:20 910

原创 2025年大模型面试题库大全:全套面试题+答案,赶紧收藏,助你面试通关!

本文整理了大模型(LLMs)面试相关的全套问题及答案,涵盖基础、进阶、微调及LangChain应用等方面。基础问题包括主流开源模型体系、涌现能力原因等;进阶问题探讨文本长度限制、复读机问题等;微调部分涉及显存需求、数据构建及缓解模型遗忘等技巧;LangChain部分解析其核心概念、使用方案及优化方法。此外还介绍了参数高效微调技术(PEFT)如LoRA、QLoRA的原理与应用。适合准备大模型相关面试的从业者参考。

2025-05-28 16:38:26 912

原创 基于大模型的企业场景化转型解决方案

随着科技的不断进步,大模型技术在各类业务场景中的应用日益广泛,为企业提供了更为强大的数据处理和分析能力。本研究聚焦于大模型技术在企业场景化转型中的应用价值,通过深入剖析大模型技术对企业运营效率的显著提升、客户体验的优化以及创新发展的推动作用,进一步验证了其在企业数字化转型过程中的重要性。

2025-05-28 16:33:08 658

原创 2025年AI知识库大比拼:腾讯IMA与飞书知识问答,谁更胜一筹?

既符合预期,又差点意思另外这个赛道貌似好像还没看到钉钉的声音,只不过前些日子使用过钉钉的KAG架构,基于知识图谱的文档解析AI知识库系统,相信钉钉最近也会发声。然后,为什么差点意思呢,原因可能在我创业失败的AI+管理的系统AI知识库稍微衍生一下其实就变成了AI Agent,知识库与Agent之间仅一步之差,以CEO数字分身为例:好的企业管理Agent,第一步是客观的展示公司信息,其中公司知识库仅仅是其中很小的一环,后续应该跟进的是员工状态、项目风险,甚至最后还要体现出系统架构的优劣等特性。

2025-05-28 16:31:26 647

原创 UI-R1小模型挑战GPT-4:136个样本8小时训练,如何实现性能逆袭?

论文:UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning链接:https://arxiv.org/pdf/2503.21620传统方法的困局:为什么训练智能GUI代理既费钱又费力?教一个新手用手机,得手把手标注成千上万张截图:“点这里”“滑那里”——这就是传统AI训练方法的日常。

2025-05-28 16:28:29 678

原创 国内AI人才流动报告:半年内19位AI大牛的职场变迁!

一直以来,百度、字节跳动、阿里巴巴等大厂在国内AI领域都占据着重要位置。自2023年至今,这些大厂的AI人才流动变得更为频繁。一方面,诸多大厂资深高管出走选择创业或者加入明星创企担任一号位;另一方面,诸多大厂选择吸纳顶尖AI大牛或者商业化进展经验丰厚的资深人士。可以看出,如今生成式AI相关的创业热潮余波未平,且大厂的部分重心已经转向实现商业化价值。

2025-05-28 16:25:49 933

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除