小城哇哇-CSDN博客

原创 AI大模型这条路，真的稳了？普通人又该如何应对？

随着 ChatGPT 的爆发，过去的一年多时间里，企业和个人对于学习和应用 AI 的必要性已经发生了革命性的转变。我们也从最初的好奇心和探索欲望，逐步深化为对自我 AI 能力的迫切需求。如今，掌握 AI 技术已经不再是选项，而是我们未来职场的一张必备门票。

2024-08-27 11:30:32 160

原创面试必备！值得收藏！不容错过的500+ 大语言模型面试问题及答案

随着人工智能技术的迅猛发展，计算机视觉（CV）、自然语言处理（NLP）、搜索、推荐、广告推送和风险控制等领域的岗位越来越受欢迎，而对于大型模型技术的掌握成为了这些岗位的标配。但目前公开的大模型资源还是很少很少，面试真题就更不用多说了。为了让大家能够应对大模型面试，整理了这份大模型面试真题及答案，对新手如何入门算法岗位、备战面试以及面试常见考点的详尽指导。这篇文章收录了你在面试时极有可能会碰到的 500+ 大语言模型面试问题。这份指南配有深入的答案，旨在帮助你更好地准备面试，以充足的信心来应对挑

2024-08-26 10:54:58 551

原创 AI不只大模型？AI Agent到底有多强？

AI Agent（AI智能体/助理/助手）“将彻底改变计算机使用方式，并颠覆软件行业”。他还预言“Android、iOS和Windows都是平台，AI Agent将成为下一个平台”。某互联网领军人物在2024年世界人工智能大会上强调：“AI Agent在高考志愿填报中发挥了重要作用，高峰日吸引了200万用户。”

2024-08-25 08:15:00 624

原创全面认识AI Agent，一文读懂AI智能体的架构指南

本文全面探讨了AI Agent的基本概念、类型、架构和关键技术对比。AI Agent作为人工智能领域的活跃分支，已经展现出其在多个行业中的实用性和变革潜力。从聊天机器人到复杂的自动化服务，AI Agent正在逐步改变我们的工作和生活方式。AI Agent作为人工智能技术的重要组成部分，其发展不仅关乎技术的进步，更关乎人类社会的未来。我们期待AI Agent能够在确保安全、伦理和可靠的前提下，为人类带来更多便利和价值。因为这个行业不同于其他行业，知识体系实在是过于庞大，知识更新也非常快。

2024-08-24 08:00:00 979

原创大模型时代：算法工程师的新挑战与机遇

随着人工智能技术的飞速发展，大模型成为了AI领域的最新爆发点。在这个背景下，传统的算法工程师已经趋于饱和，而市场急需的是具备大模型经验的算法工程师。那么，大模型时代的到来，对算法工程师的职业发展带来了哪些挑战与机遇？大模型时代的到来，对算法工程师提出了更高的要求。在这个时代，机遇与挑战并存。对于算法工程师来说，只有不断学习新知识，提升自己的技能，才能在激烈的竞争中脱颖而出，成为真正的大模型专家。而那些能够抓住机遇、勇于挑战的工程师，将有望成为AI领域的下一个弄潮儿。

2024-08-23 10:42:48 456

原创从互联网大厂到AI开发程序员：构建未来的知识服务与垂直领域小模型

在当前的技术浪潮中，越来越多的开发者正从传统的互联网大厂转向AI开发领域。在互联网行业深耕多年后，我转型成为了一名AI开发程序员，专注于大语言模型的研究与应用。结合用户的日常场景，我致力于开发面向消费者的AI工具。在这个过程中，我逐渐发现了AI领域未来发展的两大重点方向：知识服务和垂直领域小模型。从互联网大厂到AI开发程序员，这不仅仅是职业路径的变化，更是对技术发展趋势的深刻洞察。随着AI技术的不断进步，知识服务和垂直领域小模型将成为推动各行各业创新的关键力量。

2024-08-22 10:53:48 480

原创 2024年大模型的发力点：大模型Agent，分享6篇最新LLM Agent研究成果

随着对大模型的深入研究，人们逐步开始回溯大语言模型的能力。最近，Google的一篇文章重新审视了大模型的能力，指出大模型规划并不能模拟人类思维，因为人类在做规划时需要提前在头脑中进行细致的想象、策划和回溯，而大模型生成只是执行了对下一个Token的预测任务。

2024-08-21 10:18:17 856

原创 2024 人工智能最前沿：分享几个大模型(LLMs)的热门研究方向

在人工智能领域，大模型的研究正迅速发展，当前涵盖了很多个研究方向，每个方向都带有其独特的研究重点和挑战。下面给大家盘点几个比较热门的研究方向，主要包括检索增增强生成RAG、大模型Agent、Mamba、MoE、LoRA等，这些些研究方向旨在解决大模型在实际应用中的关键问题，提高性能和实用性。希望给正在找研究方向的小伙伴一些启发。

2024-08-21 10:15:19 969

原创 45页PDF || 2024年前瞻中国AI大模型场景应用趋势蓝皮书（附下载）

随着人工智能技术的飞速发展，AI大模型已成为推动各行业变革的重要力量。深圳前瞻产业研究院、首钢基金CANPLUS与华为云联合发布的《2024年中国AI大模型场景探索及产业应用调研报告》显示，2023年我国AI大模型行业规模已达到147亿元，并呈现出高速增长态势。本文将深入分析AI大模型在各行业的应用现状、痛点、趋势及未来投资机会，以期为企业提供决策参考。AI大模型是指在机器学习和深度学习领域，采用大规模参数（至少在一亿个以上）的神经网络模型。这些模型在训练过程中需要消耗大量算力和高质量数据资源。

2024-08-20 10:30:30 1725

原创全新GPT-4o mini发布！大模型杀疯了！

OpenAI再进化！全新GPT-4o mini发布，多模态AI更强大，在5月中旬，OpenAI向世界揭开了GPT-4o的神秘面纱，这个全能的多模态巨人站在了GPT-4的肩膀上，将人工智能的边界推向了新的高度！不难看出，AI大模型已是大势所趋！掌握大模型、多模态、LangChain、Fine-tuning技术的程序员、势必是未来更抢手、更具竞争力的AI技术人才！为了让大家更好的抓紧大模型机遇，给大家准备了一份涵盖AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频。

2024-08-19 11:35:40 340

原创 langchain 入门指南（二）- 如何跟大模型对话

本文中，我们会通过一个简单的例子来展示如何使用 `langchain` 来调用大模型的 `chat` API（使用 `Chat Model`）。这个例子前面也有使用过，但是前面还没有针对里面的内容进行详细的说明。

2024-08-18 08:15:00 1003

原创 langchain 应用开发入门指南（一）

在开始之前，我们需要先准备一个可以调用 OpenAPI 的 key，又或者是其他 LLM 的 key。因为墙的原因，所以没有办法直接使用 OpenAI 的 key 来调用，但是我们可以使用一些替代品或者代理，可选的有：零一万物：使用的是它自身提供的 LLM，https://platform.lingyiwanwu.com/docsOpenAI HK：可以使用 OpenAI 的 LLM，https://openai-hk.com/智谱清言：使用的是它自身提供的 LLM，https://open.b

2024-08-17 08:00:00 960

原创资源｜备战金九银十，LeetCode高频AI大模型面试题合集

金九银十来了，你准备好备战了么！而最高效的准备方式，不外乎刷题、刷题、刷题。刷题就不得不提 LeetCode 了~俗话说的好：LeetCode刷不好，一面都过不了。所以，今天就将一些 LeetCode 大厂AI大模型高频面试题整理成合集分享给大家，希望能助大家一臂之力~每一章节都是站在企业考察思维出发，作为招聘者角度回答。从考察问题延展到考察知识点，再到如何优雅回答一面俱全，可以说是求职面试的必备宝典，每一部分都有上百页内容，接下来具体展示，完整版可直接下方扫码领取。

2024-08-16 11:56:57 503

原创深度讲解AI大模型原理，它到底是如何工作的

现在很多朋友都在研究AI大模型；对各个公司的大模型更是数如家珍。“chatgpt、Claude、Gemini、Llama3、文心一言、千问...”国外的、国内的、开源的、不开源的；只要出来一个大模型，就要注册，试一试效果。但我想问的是：你真正了解它们是如何工作的吗？大家可以尝试回答下面这几个问题；

2024-08-15 10:30:05 615

原创超全面！24年秋招1000+道AI大模型中大厂面试题集锦（含答案）

整理这些面试题源于在微信群和几个刚入职的小伙伴们的一次讨论，很多小伙伴谈了自己的面试经历和体会，很多人最初鄙视刷题党，觉得开发技能最重要，但在短暂的面试过程中很挫败。转而去看面试题，但是网上面试题太多但又不全，查找很不方便，多是看过的又看，看十道才能看到面试的题目，极大的浪费了求职期间的宝贵时间。最后大家一拍即合，准备各自把面试笔试以及自己看过好的题目收集起来，整理出来让后来的小伙伴们少踩些坑，所以有了这些题目。接下来直接看面试题吧！！！

2024-08-14 11:53:14 524

原创读完这本书，我终于搞懂了Transformer、BERT和GPT！【附PDF】

Transformer、BERT和GPT: 包括ChatGPT和提示工程》是一本深入浅出地介绍自然语言处理领域前沿技术的专著，全书一共379页PDF，是截止到目前比较系统介绍NLP和GPT融合领域的书籍。全书共十章，内容丰富，结构清晰，从基础的概念和原理讲起，逐步深入到最新的研究和应用。下载当前版本：完整PDF书籍链接获取，可以V扫描下方二维码免费领取👇👇👇首先，本书从注意力机制这一核心概念出发，为读者揭示了自然语言处理中的关键机制。

2024-08-13 11:58:49 595

原创死磕这本《大语言模型综述》，看完直接脱胎换骨！！

大模型技术正处于快速发展阶段，基础原理亟待探索、关键技术亟待改善。对于科研人员而言，大模型研究工作充满了想象空间，令人为之神往。随着技术的不断进步与共享开放，我们有理由相信，未来人工智能技术将取得更大的进展，将在更多领域带来更为深远的影响。List item而《大语言模型》这本书旨在为读者提供关于大模型技术的全面了解，包括其基础原理、关键技术和应用前景。通过深入研究和实践，我们可以不断探索和改进大模型技术，为人工智能领域的发展做出贡献。

2024-08-12 17:58:38 169

原创文弄懂 LLM 结构化数据生成原理

目前 LLM（Large Language Model）从文本补全到内容创作，都展示出了强大的生成能力。然而通过 LLM 生成结构化的数据如 JSON 格式的输出，却仍然是一个有挑战性的任务。生成结构化的数据不仅要求模型输出符合特定的语法规则，还需要确保数据的正确性和一致性。虽然通过 prompt 工程可能可以实现指定格式的结构化数据生成，但是这也很大程度取决于模型的能力。

2024-08-11 08:30:00 594

原创 AI大模型全套学习资料+学习路线分享，建议人手一份

2013年毕业以来，我在不同的公司工作过，也观察到了许多同行的一个共同现象：一些看似技术高超或勤奋努力的同事，在尝试转换岗位或寻求更高薪资时却屡屡受挫。缺乏对技术的深度理解：虽然你知道如何使用某种工具或技术，但对其背后的原理和技术细节知之甚少。深入了解技术的本质能让你在遇到问题时迅速定位根源，并通过阅读源码来解决问题。在高水平的技术面试中，考官往往会深入挖掘候选人的技术深度。缺乏系统的知识框架：一个完整的知识体系是高级技术人员不可或缺的基础。

2024-08-10 10:26:00 515

原创回归冷静，产品经理该如何面对AI大模型？

在移动互联网高速发展的时代，产品经理一度成为最火爆的职业，人人都想当产品经理，有很多人说：产品经理的上限极高，它应该是CEO式的岗位。事实上，我们看到新型互联网科技公司的CEO也确实都是产品出身。但是这几年产品经理们经常焦虑，焦虑的原因就在于：移动互联网的增长已经见底，红利已消失，需求已经挖掘的差不多了，新需求很少。大家都在拼存量，所以大家都很卷。现在AI来了，对于产品经理来说，有危机，也有转机。产品经理有几个核心工作：竞对分析、需求挖掘、原型/PRD产出、产品管理、数据分析、文档撰写、沟通对齐。

2024-08-09 11:53:01 1440

原创有了这份全套学习路线+AI大模型高频常问面试题宝典，面试不愁了！

近期，我也刚亲身经历了一轮动荡，并成功觅得新的职业机会。借此契机，我愿意结合最近的面试经历，分享一些心得体会。一、基础知识体系尚未系统完善二、所参考学习的资料质量不高或针对性不强对于前者，当你真切意识到理想职位所对应的丰厚薪资待遇时，或许会激发出自我提升的动力；而后者，则是我接下来将要深入剖析和重点讨论的部分。

2024-08-09 11:41:21 758

原创 AI产品经理自学不迷路！AI产品大模型的学习路径

没有固定形态。实际上AI只是一种对传统产品或服务赋能的手段而已，将各种“中间件”（通常是一种训练好的模型，当输入一定数据后自动返回一定的输出值）、传感器等不同形式的软件、硬件融入传统产品或服务的使用或体验流程中。AI只是一种工具而已，产品的终极目标仍然不变为用户创造最大价值，提供最佳用户体验。

2024-08-08 17:14:14 817

原创卷爆大模型，引发硅谷大厂打擂台赛的AI Agent到底是何方神圣？

代理”这个词在AI出现之前就有了，哲学家们研究过它。像亚里士多德和大卫·休谟这样的大思想家都讨论过代理的概念，他们认为只要能自己做决定，不管是人、动物还是别的东西，都能称作代理。到了20世纪80年代，AI的研究者也开始关注这个概念了。目前，我们倾向于把所有能够感知环境、做出决策并采取行动的实体或系统视为人工智能领域的代理。而AI Agent，即人工智能代理，被定义为一个能够自主执行任务、做出决策并与环境交互的系统。

2024-08-08 16:26:25 1475

原创 NLP中的预训练语言模型（二）—— Facebook的SpanBERT和RoBERTa

本篇带来Facebook的提出的两个预训练模型——SpanBERT和RoBERTa。

2024-08-07 10:01:49 802

原创 NLP中的预训练语言模型（一）—— ERNIE们和BERT-wwm

随着bert在NLP各种任务上取得骄人的战绩，预训练模型在这不到一年的时间内得到了很大的发展，本系列的文章主要是简单回顾下在bert之后有哪些比较有名的预训练模型，这一期先介绍几个国内开源的预训练模型。

2024-08-07 09:59:46 900

原创学习LLM大模型，不容错过的《大语言模型：基础与前沿》（附PDF下载）

就目前来看，大量工作正逐渐被大型语言模型（LLM）所替代，就比如文本自动生成、智能客服、数据分析和预测等多个领域。这暗示着LLM正逐步成为支撑社会运作的关键基础设施。未来，比Devin更为智能的LLM将会问世。我们当前的任务是深入理解其原理，熟练掌握其应用，以达到运用自如的境界。今天给大家介绍这本《大语言模型：基础与前沿》

2024-08-06 14:11:23 692

原创人工智能LLM模型：奖励模型的训练、PPO 强化学习的训练、RLHF

奖励模型通过与人类专家进行交互，获得对于生成响应质量的反馈信号，从而进一步提升大语言模型的生成能力和自然度。与监督模型不同的是，奖励模型通过打分的形式使得生成的文本更加自然逼真，让大语言模型的生成能力更进一步。通过强化学习的训练方法，迭代式的更新奖励模型（RW 模型）以及策略模型（RL 模型），让奖励模型对模型输出质量的刻画愈加精确，策略模型的输出则愈能与初始模型拉开差距，使得输出文本变得越来越符合人的认知。这种训练方法也叫做 RLHF。

2024-08-06 10:02:04 935

原创强化学习常见面试题：近端策略优化（proximal policy optimization，PPO）算法

使用另外一种分布，来逼近所求分布的一种方法，算是一种期望修正的方法，公式如下：我们在已知qqq的分布后，可以使用上式计算出从ppp分布的期望值。也就可以使用qqq来对ppp进行采样了，即重要性采样。因为这个行业不同于其他行业，知识体系实在是过于庞大，知识更新也非常快。作为一个普通人，无法全部学完，所以我们在提升技术的时候，首先需要明确一个目标，然后制定好完整的计划，同时找到好的学习方法，这样才能更快的提升自己。

2024-08-06 09:52:45 869

原创免费下载 |《从零开始大模型开发与微调：基于PyTorch与ChatGLM》PDF

大型模型是深度学习的核心，目前它在人工智能和自然语言处理（NLP）的研究与产业领域中占据着极其重要的地位。今天给大家带来一本以PyTorch 2.0作为研究和掌握大型模型的基础平台，并以ChatGLM为案例，深入浅出地阐述了大型模型的原理、算法、编程实现、实际应用以及调优技巧，旨在向读者揭开大型模型开发的神秘面纱的书籍——《从零开始大模型开发与微调：基于PyTorch与ChatGLM》。

2024-08-05 16:08:43 902

原创强化学习常见面试题：深度确定性策略梯度DDPG算法、双延迟深度确定性策略梯度TD3算法详解

**深度确定性策略梯度（deep deterministic policy gradient，DDPG）**：在连续控制领域经典的强化学习算法，是深度Q网络在处定性”表示其输出的是一个确定的动作，可以用于连续动作环境；“策略梯度”代表的是它用到的是策略网络，并且每步都会更新一次，其是一个单步更新的策略网络。其与深度Q网络都有目标网络和经验回放的技巧，在经验回放部分是一致的，在目标网络的更新上有些许不同。

2024-08-05 09:57:35 563

原创强化学习常见面试题：演员-评论员算法（advantage actor-critic，A2C），异步A2C、与生成对抗网络的联系等详解

异步优势演员-评论员算法，即算法一开始会有一个全局网络，其包含策略部分和价值部分。假设它的参数是theta1\\theta\_1theta_1，假设对于每一个演员都用一个CPU训练，每一个演员工作前都会将全局网络的参数复制进来。然后演员与环境进行交互，每一个演员与环境交互后，都会计算出梯度并且更新全局网络的参数。这里要注意的是，所有的演员都是并行运行的。所以每个演员都是在全局网络复制了参数以后，执行完再把参数传回去。所以当第一个演员执行完想要把参数传回去的时候，本来它要的参数是t。

2024-08-05 09:52:11 1007

原创强化学习从基础到进阶-常见问题和面试必知必答[5]：：梯度策略、添加基线（baseline）、优势函数、动作分配合适的分数（credit）

策略（policy）**：在每一个演员中会有对应的策略，这个策略决定了演员的后续动作。具体来说，策略就是对于外界的输入，输出演员现在应该要执行的动作。一般地，我们将策略写成 $pi$ 。

2024-08-04 08:45:00 748

原创强化学习从基础到进阶-常见问题和面试必知必答[4]：：深度Q网络-DQN、double DQN、经验回放、rainbow、分布式DQN

深度Q网络（deep Q-network，DQN）**：基于深度学习的Q学习算法，其结合了价值函数近似（value function approximation）与神经网络技术，并采用目标网络和经验回放等方法进行网络的训练。

2024-08-03 08:45:00 356

原创产品经理如何快速掌握大模型技术，享受AI红利？

随着人工智能（AI）技术的快速发展，AI产品经理的角色变得越来越重要。尽管AI产品经理并不是一个新鲜的概念，但随着AI技术的迭代升级，这一角色的重要性得到了显著提升。

2024-08-02 20:22:49 1603

原创强化学习从基础到进阶-常见问题和面试必知必答[3]：表格型方法：Sarsa、Qlearning；蒙特卡洛策略、时序差分等以及Qlearning项目实战

**概率函数和奖励函数**：概率函数定量地表达状态转移的概率，其可以表现环境的随机性。但是实际上，我们经常处于一个未知的环境中，即概率函数和奖励函数是未知的。

2024-08-02 09:54:49 819

原创强化学习从基础到进阶-常见问题和面试必知必答[2]：马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代

马尔可夫决策过程中的状态转移与马尔可夫奖励过程中的状态转移的结构或者计算方面的差异有哪些？

2024-08-02 09:52:35 786

原创成为AI产品经理，为何应选择LLMs方向？

随着人工智能（AI）技术的快速发展，越来越多的人开始考虑如何在这个领域找到自己的位置。对于那些希望成为AI产品经理的人来说，选择LLMs（Large Language Models，大型语言模型）方向是一个非常明智的选择。

2024-08-01 20:58:54 621

原创强化学习从基础到进阶-常见问题和面试必知必答[1]：强化学习概述、序列决策、动作空间定义、策略价值函数、探索与利用、Gym强化学习实验

强化学习（reinforcement learning，RL）**：智能体可以在与复杂且不确定的环境进行交互时，尝试使所获得的奖励最大化的算法。

2024-08-01 16:28:31 597

原创强化学习从基础到进阶-案例与实践[1]：强化学习概述、序列决策、动作空间定义、策略价值函数、探索与利用、Gym强化学习实验

**强化学习（reinforcement learning，RL）** 讨论的问题是智能体（agent）怎么在复杂、不确定的环境（environment）中最大化它能获得的奖励。如图 1.1 所示，强化学习由两部分组成：智能体和环境。在强化学习过程中，智能体与环境一直在交互。智能体在环境中获取某个状态后，它会利用该状态输出一个动作（action），这个动作也称为决策（decision）。然后这个动作会在环境中被执行，环境会根据智能体采取的动作，输出下一个状态以及当前这个动作带来的奖励。智能体的目的就是尽

2024-08-01 16:26:23 916

原创大龄程序员转型攻略：拥抱人工智能，开启新征程

随着科技的飞速发展，人工智能浪潮席卷全球，相关岗位炙手可热。在这个背景下，许多大龄程序员开始思考如何转型，以适应时代的变化。结合自身编程基础，大龄程序员可以学习机器学习、深度学习算法，投身于人工智能的研发与应用，找到自己的新定位。

2024-07-31 22:12:08 975

空空如也

空空如也