ID_LWQ-CSDN博客

原创探索智能体的记忆：类型、策略和应用

记忆实现是使智能体能够保持上下文、从过去的交互中学习并做出明智决策的关键组成部分。与人类记忆非常相似，智能体记忆允许 AI 系统随时间存储、检索和利用信息，从而为用户创造更连贯和个性化的体验。

2025-05-07 15:05:11 1077

原创各厂大模型及其优势

本文详细介绍了Openrouter中集成的各大语言模型(LLMs)的优势。以下是对每个模型的简明概述。每个部分包括简短描述、模型的优势和最适合使用该模型的用户群体。

2025-05-08 12:37:19 572

简单来说，Copilot网关就是AI世界的"超级调度中心"，它可以智能地将你的问题路由到最合适的专业AI助手那里。就像一位经验丰富的接线员，了解每个专家的专长，确保你的问题能够得到最专业的解答。Copilot网关代表了AI助手发展的新方向——从单打独斗到团队协作，从用户手动选择到智能自动路由。它不仅解决了当前AI助手分散、缺乏协作的痛点，还通过中央调度机制大幅提升了用户体验和问题解决效率。对于开发者而言，这提供了构建更加智能、协作的AI生态系统的新思路；

2025-05-08 11:59:08 666

原创扣子(Coze)的记忆系统详解

Coze平台的记忆系统提供了从短期到长期、从简单变量到复杂数据库的全方位记忆解决方案，让开发者能够打造出真正"有记性"的AI应用。通过合理结合变量、数据库和长期记忆功能，可以创建出具有持续学习能力、能够提供个性化服务的智能助手。我们可以期待Coze平台未来会提供更多元化的记忆实现方式，例如情感记忆、情境记忆等更加细分的记忆类型，让AI助手的"智商"和"情商"都得到质的飞跃。是否已经在Coze平台上尝试过这些记忆功能？有什么开发心得想要分享？欢迎在评论区留言讨论！

2025-05-07 15:27:12 913

原创多智能体协同作战：MagenticOne如何指挥一支AI团队

多智能体系统，尤其是像MagenticOne这样的先进架构，正在重新定义AI工具的边界。通过让专业化的AI智能体协同工作，它们能够解决单一智能体难以应对的复杂任务。随着技术不断发展，我们可以期待这些AI团队变得更加灵活和强大，成为我们工作中不可或缺的伙伴。

2025-04-30 18:41:12 702

原创 Devin下一代自主AI软件工程师人人可用

Devin是一款自主的AI软件工程师，充分利用了大型语言模型（LLM）的强大能力，能够理解代码、生成代码，并与开发环境进行交互。无论是代码审查、代码迁移、问题修复，还是构建Web应用程序，Devin都能胜任。甚至，它还能执行个人助理任务，比如在您忙于编码时为您订购午餐。Devin代表了软件工程领域的新趋势，利用人工智能的力量，帮助开发者更高效地完成任务。无论是代码迁移、大型重构，还是提高工程效率，Devin都能成为您的有力助手。现在就试试Devin，体验AI时代的编程新方式吧！

2024-12-13 09:00:00 2251

原创 Chatto企业AI助手产品技术拆解(上)

Chato是一款智能对话AI助手平台，可以帮助企业快速定制独特个性和超强能力的专属AI助手，将AI助手运用到多种对外的应用和使用场景。某知名电商平台，他们使用ChatoAI助手作为客服智能助手，帮助用户解答问题、提供售后服务、进行投诉处理等等。通过ChatoAI助手的智能问答技术，用户可以快速获取到所需的信息和服务，提高了用户的满意度和忠诚度。同时，AI助手还可以根据用户的历史记录和行为进行智能推荐和个性化服务，提高了用户的购物体验和转化率。以上便是本文内容，主要涵盖了智能助手定制过程与知识库管理。

2024-07-13 17:10:18 1070

原创 AI智能客服项目拆解(1) 产品大纲

AI智能客服是一种基于人工智能技术的客户服务解决方案，旨在提高客户满意度和优化企业运营。利用人工智能和自然语言处理技术，为企业提供高效、便捷的客户服务。与传统客服相比，智能客服具有**自动回复、快速响应、个性化推荐**等特点，能够显著**提高客户满意度**和**降低企业成本**。智能客服的实现依赖于大规模**知识处理**、**自然语言理解**、**知识管理**和**自动问答系统**等。智能客服还支持多渠道接入，包括网站、APP、社交媒体等，方便客户随时随地获得服务。在选择和部署智能客服时，需要考虑多

2024-06-30 17:02:41 1968 1

原创【AI产品榜单】盘点国内流量Top10的AI产品

榜单数据源自aicpb，本文摘选出访问流量Top10的产品，逐个为大家介绍文心一言，Kimi Chat,秘塔AI，阿里通义千问，火山方舟，清华智谱，讯飞星火，抖音豆包，AIPPT,稿定AI

2024-04-20 18:51:31 2346 4

原创【思维链刷题】掌握解题思维链，轻松拿下LeetCode 数位DP Hard题

今天要讲的是一种方法论，即思维链刷题，你可以通过刻意练习，通过一步一步的暗示，来达到解题的目标。正如大模型能够在COT（思维链）的加持下能够一步一步的得到最终的答案，我们在解决LeetCode的编程题时又何尝不是按照这种方式呢？不同的是，我们并没有人给我这种思维链般的“提示”，来指引我们一步一步的通过思考下一步应该做什么，来得到最终的代码。我们只能依靠大脑，不断地提示自己，遵照某一个思维链来解题。那么关键来了，有些人在解题的时候，没有思路，或者思路混乱，这都是思维链没有成型导致的。

2024-04-20 11:19:49 842 1

原创【推理优化】超详细！AIGC面试系列大模型推理系列(2)

本期问题快览有哪些常见的大模型推理优化技术介绍下通过流水线处理技术来加速大模型推理方案介绍下并行计算技术来加速大模型推理的方案有哪些通过硬件来加速大模型推理的方式？模型量化是如何加速大模型推理的？有哪些通过缓存来加速大模型推理的方式？vLLM 如何优化大模型并行推理加速什么是 PagedAttention？PagedAttention 技术细节什么是Flash Attention？Flash Attention 技术细节？

2024-04-19 21:59:15 4165 4

原创斯坦福团队出品，目前最好的AI长文生成？

STORM（Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking）是一个由斯坦福大学研究人员开发，旨在利用大语言模型（LLMs）自动化从头开始编写具有维基百科页面般的广度和深度的有根据和有组织的长篇文章。STORM旨在模拟文章写作前的调研过程，通过发掘话题研究中的多样视角、模拟具有不同视角的作者向话题专家提出问题的对话，以及基于这些对话整理收集到的信息来创建文章大纲。

2024-04-19 21:00:42 1802 1

原创【Tokenizer原理篇】超详细！AIGC面试系列大模型进阶(5)

本期问题快览模型中的Tokenization是指的什么常用的Tokenization方法了解有哪些吗了解什么是Byte-Pair Encoding(BPE)吗介绍下Byte-Pair EncodingBPE的核心算法了解什么是WordPiece吗介绍一下 WordPiece 思路了解什么是SentencePiece吗介绍一下 SentencePiece 思路Byte-Pair Encoding, WordPiece, SentencePiece这三者有什么区别不同大模型LLMs 的分词方

2024-04-18 17:50:34 4364 1

原创【推理框架】超详细！AIGC面试系列大模型推理系列(1)

本期问题快览有哪些大模型推理框架了解vllm吗介绍下vllm的核心技术了解faster transformer吗介绍下faster transformer的核心技术了解Xinference吗了解llama.cpp项目吗llama.cpp项目突出的优势是什么

2024-04-18 17:49:37 4927 2

原创【模型微调】超详细！AIGC面试系列大模型进阶(4)

本期问题聚焦于大模型微调与微调相关技术什么情况下需要微调大模型？什么是大模型参数微调？什么是大模型的指令微调？大模型参数微调的好处？大模型指令微调的好处？预训练和有监督微调操作有什么不同？多轮对话任务如何微调模型？微调后的模型出现能力劣化，灾难性遗忘是怎么回事？微调模型需要多大显存？

2024-03-25 19:58:55 2153 1

原创超详细！AIGC面试系列大模型进阶(3)

如何训练自己的大模型？训练中文大模型有啥经验？什么情况下需要预训练大模型样本量规模增大，训练大模型时出现OOM错，怎么解决？模型训练的数据集一般从哪里找？如何解决三个阶段的训练（SFT->RM->PPO）过程较长，更新迭代较慢问题？奖励模型在训练大模型中有什么作用？在训练大型语言模型的过程中，如何确保模型的公平性和无偏见？

2024-03-25 19:41:57 1167 1

原创超详细！AIGC面试系列大模型进阶(2)

如何让大模型处理更长的文本？如果想要在某个模型基础上做全参数微调，究竟需要多少显存？什么是有监督微调SFTSFT 指令微调数据如何构建?领域数据训练后，通用能力往往会有所下降，如何缓解模型遗忘通用能力？领域模型Continue PreTrain ，如何让模型在预训练过程中就学习到更多的知识？进行SFT操作的时候，基座模型选用Chat还是Base?领域模型微调领域评测集如何构建

2024-03-11 22:01:47 1999

原创超详细！AIGC面试系列大模型进阶(1)

大模型常用的激活函数有哪些？Multi-query Attention 与 Grouped-query Attention 是否了解？区别是什么？GPT3、LLAMA、ChatGLM 的Layer Normalization 的区别是什么？各自的优缺点是什么？llama 输入句子长度理论上可以无限长吗？大模型长下文能力的提升关键是什么？什么是 LLMs 复读机问题？为什么会出现 LLMs 复读机问题？如何减轻LLMs的复读机问题？什么情况用Bert模型，什么情况用LLaMA、ChatGLM类

2024-03-11 21:44:20 1440

原创超详细！AIGC面试系列大模型基础(2)

本期问题快浏1. 大模型领域的Scalling law是什么意思2. 大模型的Tokenizer的实现方法及原理？3. 为什么大模型这么消耗显存？4. 简要介绍下Transformer架构5. 训练一个大模型需要哪些步骤？6. 微调一个大模型需要哪些步骤？

2024-03-10 15:54:22 1650 1

原创超详细！AIGC面试系列大模型基础(1)

本系列是结合AI搜索技术所得素材然后整理笔记而成。所有问题答案均由AI提供初稿，而后修缮而成。担心提供错误答案怎么办？每个问题回答后面我都会放上原文的链接，方便大家深度阅读。我会尽量根据自己的判断，审核一下AI的回复做点修正，如有纰漏尽情谅解。另外有覆盖不到的问题，尽情留言，我可能不会逐一回复，但一定会在下期更新。

2024-03-10 15:17:39 2933 1

原创探索元宇宙的数字分身: 数字人行业简析

有人在使用数字人的同时，就有人担心自己被数字人欺骗。有些人可能会用数字人来传。现在，有一些公司和个人开始用数字人在短视频、广告和其他地方跟用户互动。这些数字人看起来很真实，但可能存一些问题：1. 虚假宣传：有些公司可能会使用数字人来做广告，可能会夸大数字人的能力或者误导消费者，导致虚假宣传。2. 侵犯隐私：有时候，数字人的形象可能会被不法分子用来侵犯别人的隐私，比如在媒体上发布虚假信息或者恶意攻击。3. 伦理问题：数字人的使用也涉及到伦理问题。例如，如果一个数字人被用来制作淫秽、暴力或令人不悦的内容。

2024-03-09 11:41:38 1199 1

原创微软Copilot插件开发系列（一）

懂AI PC的人要先拥抱新世界了。继联想、荣耀之后，微软的首款AI PC马上也要来了。去年9月，Colpilot正式进入Windows 11，成为电脑系统的AI助手。但是，Copilot 无法获取第三方服务的实时信息，例如最新的新闻、天气、股票等。这时，我们就可以使用 OpenAI schema 开发Copilot 插件，来扩展Copilot 的功能，让它能够与我们自己的 API 交互。本文作为该系列的第一篇，将带你初步了解下copilot的基本概念和开发示例。

2024-03-09 10:51:13 2209 1

原创中外论文搜集方法整理

中外论文搜集方法整理中文文献IData爱学术外文文献中国科技云Library Genesis中文文献中文文献数据库常见的有中国知网和万方数据，二者几乎涵盖了国内所有领域的中文文献。校园网用户可直接通过IP登录进行文献搜索下载，然对于非校园用户，除购买正式会员外，亦可以通过相关论文资料搜索网站以及代理等方式达到同样效果。IDataIData值得推荐，其数据库较为充实，更新也及时，中文期刊、硕...

2018-12-19 15:18:46 560

文奇的博客