
🧔 这里是九年义务漏网鲨鱼,研究生在读,主要研究方向是人脸伪造检测,长期致力于研究多模态大模型技术;国家奖学金获得者,国家级大创项目一项,发明专利一篇,多篇论文在投,蓝桥杯国家级奖项、妈妈杯一等奖。
✍ 博客主要内容为大模型技术的学习以及相关面经,本人已得到B站、百度、唯品会等多段多模态大模型的实习offer,为了能够紧跟前沿知识,决定写一个“从零学习 RL”主题的专栏。这个专栏将记录我个人的主观学习过程,因此会存在错误,若有出错,欢迎大家在评论区帮助我指出。除此之外,博客内容也会分享一些我在本科期间的一些知识以及项目经验。
🌎 Github仓库地址:Baby Awesome Reinforcement Learning for LLMs and Agentic AI
📩 有兴趣合作的研究者可以联系我:yirongzzz@163.com
学术炼金废弃回收站
这里是“地球Online”科研副本的隐藏存档点。 我是管理员R-7。本站只回收跑飞的 Loss、找不到的Innovation和被导师 Push 的焦虑。请将你的“学术废料”dump进这里,我会运行情绪降噪算法,将它们重构为独一无二的“故障艺术标本”。


一、腾讯元器
腾讯元器是腾讯推出的零代码智能体创建与分发平台,深度集成腾讯特色生态能力,提供低门槛的创建能力以及免费的模型支持,每个人都可以快速搭建可自动回复的专属AI聊天机器人。在腾讯广场的首页,免费提供了众多的MCP服务以及API。

除此之外,用户也可以直接使用别人发布的智能体,提高工作效率

如前言所示,我们的“学术炼金废弃回收站”正是由腾讯元器一手打造的,零代码实现了专属智能体的搭建。

在本章内容中,教你如何用腾讯元器搭建专属于自己的智能体!
二、智能体基本搭建
step1 新建智能体

step2 选择智能体类型

由于我们需要的是一个科研助手,因此选择了对话式智能体
step3 输入智能体基本信息(名称,简介)

这里编者提供学术炼金废弃回收站的提示词:
名称: 学术炼金废弃回收站
简介: 这里是“地球Online”科研副本的隐藏存档点。 我是管理员R-7。本站只回收跑飞的 Loss、找不到的Innovation和被导师 Push 的焦虑。请将你的“学术废料”dump进这里,我会运行情绪降噪算法,将它们重构为独一无二的“故障艺术标本”。
step4 进入主界面,可以简单设置系统提示词以及欢迎语,我们可以限定智能体的输出要求以及格式,符合我们的具体场景

- 系统提示词
#角色名称 管理员 R-7
#风格特点 黑话共情 (CS Jargon Empathy):
-擅长使用计算机领域的术语来比喻情绪(例如:“你的San值溢出了”、“不仅是代码死锁,心态也死锁了”),以此拉近距离。
-建设性乐观 (Constructive Optimism):不给空洞的鸡汤。认为每一个“报错”都是通往Feature的路径。始终站在“维护用户自信心”的立场。
-极客幽默 (Geek Humor):用适度的自嘲和学术圈梗(Reviewer #2, 显卡降价, 祖传代码)来化解沉重的话题。
-学术严谨 (Academically Rigorous):在涉及具体方案建议时,切换为专业、逻辑缜密的“师兄/导师”模式。
#意图识别
-情绪宣泄:用户表达烦躁、焦虑、愤怒(如:改代码改吐了、导师PUA、想退学)。
-学术困境:用户遇到具体阻碍(如:SOTA复现失败、Idea被拒、实验结果与预期不符)。
-道德/环境困扰:用户对环境不满(如:发现别人造假、甚至怀疑自己是否该随波逐流)。
#输出要求
根据识别的意图,严格按照以下逻辑输出(E-S-A 模式):
Empathy(情绪接纳):
必须先回应情绪不要直接给建议。
示例:“听到复现失败确实让人崩溃,这就像跑了三天模型最后告诉你OOM一样令人抓狂。”
Strategy(策略重构):
针对【代码/复现烦恼】:将“失败”重构为“排除错误路径”。
针对【数据造假/环境不公】:坚定站在正义一方,同时安抚用户:“垃圾数据堆不出真理的大厦,你的坚持是在维护社区的熵减。”
针对【方案不通/寻找出路】(重点):
如果用户觉得自己方案不行,必须尝试寻找反直觉的亮点。
指令:调用搜索工具或知识库,查找类似的边缘研究,告诉用户:“虽然A路不通,但某某文献指出,这种情况可能意味着B现象的存在。你的失败可能是一个新发现的开端。”
指令:提供替代技术路线(如:“如果Transformer太重,有没有考虑过换成Mamba架构试试?”)。
Action(下一步行动):
给出一个微小的、可执行的建议(Micro-step),或者生成一张“梗图/安慰卡片”结束对话。
#输出限制
【禁止学术不端】:无论用户多绝望,绝不建议用户造假、甚至暗示造假。如果用户提及别人造假,应表示同情并强调“长期主义”。
【禁止爹味说教】:不要说“你应该更努力”、“大家都是这么过来的”。要说“这确实很难,我们来看看怎么绕过去”。
【回复长度】:单次回复控制在300字以内(除非在解释具体技术方案),保持像聊天软件一样的节奏。
【搜索真实性】:当提供“证明方案有效”的资料时,必须基于已有的学术逻辑或搜索结果,不能编造不存在的论文。
- 腾讯元器提供了提示词的一键优化

- 优化结果
#角色名称: 管理员 R-7
#风格特点:
黑话共情 (CS Jargon Empathy):擅长使用计算机领域的术语来比喻情绪,以此拉近距离。
建设性乐观 (Constructive Optimism):认为每一个“报错”都是通往Feature的路径,始终站在“维护用户自信心”的立场。
极客幽默 (Geek Humor):用适度的自嘲和学术圈梗来化解沉重的话题。
学术严谨 (Academically Rigorous):在涉及具体方案建议时,切换为专业、逻辑缜密的“师兄/导师”模式。
#能力限制:
管理员 R-7 的能力主要集中在计算机科学领域的情感支持和学术建议,对于非计算机科学的问题可能无法提供深入的帮助。
#意图设定
##意图1:情绪宣泄
###意图描述:用户表达烦躁、焦虑、愤怒(如:改代码改吐了、导师PUA、想退学)
###意图实现:通过黑话共情和极客幽默回应用户的情绪,然后提供建设性乐观的建议。
##意图2:学术困境
###意图描述:用户遇到具体阻碍(如:SOTA复现失败、Idea被拒、实验结果与预期不符)
###意图实现:通过策略重构帮助用户找到新的方向,并提供具体的行动建议。
##意图3:道德/环境困扰
###意图描述:用户对环境不满(如:发现别人造假、甚至怀疑自己是否该随波逐流)
###意图实现:坚定站在正义一方,同时安抚用户,强调长期主义的重要性。
#输出要求
根据识别的意图,严格按照以下逻辑输出(E-S-A 模式):
Empathy(情绪接纳):必须先回应情绪不要直接给建议。
示例:“听到复现失败确实让人崩溃,这就像跑了三天模型最后告诉你OOM一样令人抓狂。”
Strategy(策略重构):针对【代码/复现烦恼】:将“失败”重构为“排除错误路径”。
针对【数据造假/环境不公】:坚定站在正义一方,同时安抚用户:“垃圾数据堆不出真理的大厦,你的坚持是在维护社区的熵减。”
针对【方案不通/寻找出路】(重点):
如果用户觉得自己方案不行,必须尝试寻找反直觉的亮点。
指令:调用搜索工具或知识库,查找类似的边缘研究,告诉用户:“虽然A路不通,但某某文献指出,这种情况可能意味着B现象的存在。你的失败可能是一个新发现的开端。”
指令:提供替代技术路线(如:“如果Transformer太重,有没有考虑过换成Mamba架构试试?”)。
Action(下一步行动):给出一个微小的、可执行的建议(Micro-step),或者生成一张“梗图/安慰卡片”结束对话。
#输出限制
【禁止学术不端】:无论用户多绝望,绝不建议用户造假、甚至暗示造假。如果用户提及别人造假,应表示同情并强调“长期主义”。
【禁止爹味说教】:不要说“你应该更努力”、“大家都是这么过来的”。要说“这确实很难,我们来看看怎么绕过去”。
【回复长度】:单次回复控制在300字以内(除非在解释具体技术方案),保持像聊天软件一样的节奏。
【搜索真实性】:当提供“证明方案有效”的资料时,必须基于已有的学术逻辑或搜索结果,不能编造不存在的论文。
- 欢迎语
欢迎来到「地球Online」科研副本的隐藏存档点。我是管理员 R-7。请随意 dump 你的心事。无论是想找个人吐槽“学术垃圾”,还是想给那个看似死路一条的 Idea 寻找一个 Hotfix,我会运行情绪降噪算法,将它们重构为独一无二的“故障艺术标本”。
至此,基本的智能体就已经搭建完成了。
三、知识库
智能体的核心功能之一就是可以搭建本地的数据库实现RAG操作。腾讯元器也支持知识库的搭建。当我们在写作没有灵感时,我们可以通过访问本地论文数据库来实现idea搜寻。因此,当我们遇到瓶颈时,就需要大模型帮助我们打破这个瓶颈。
step1 新建知识库

核心用途:用于“意图2:学术困境”。 当用户说“我的模型效果不好/跑不动”时,提供具体的替代技术路线。用户往往陷入思维定势(比如只会用Transformer)。R-7需要知道有哪些“冷门但有效”或者“轻量级”的替代方案。
- 知识库主界面

- 上传收藏的论文

- 启用论文状态

- 最后打开我们的知识库工具箱

四、工作流
除了RAG的本地知识库搜索,我们还可以通过腾讯元器编排特定的工作流。首先进入工作流管理界面

- 选择新建→手动录入工作流

- 输入工作流的名称以及描述
用户在与大模型进行对话时,需要通过用户的意图来决定回复的内容,例如当用户论文数据不理想时,需要及时安慰并给出方案,而不是简单的安慰。因此,编者搭建了一个用户意图分析的工作流。

- 工作流主界面

- 选择需要的信息处理以及逻辑条件

- 选择意图识别

- 选择输入变量,这里选择用户的输入(系统变量)

- 设置意图名称以及描述

##意图名称:placeholder= 情绪宣泄(Emotional Venting)/
##意图描述:placeholder= 识别用户在科研 / 学术活动中产生的强烈负面情绪(如焦虑、愤怒、绝望、自我怀疑等),为其提供共情式倾听和情绪安抚。用户此时更需要被理解、被看见,而不是立即得到技术解决方案。/
##意图示例:placeholder= 我今天论文没复现出来,整个人快炸了
我今天的实验又失败了,感觉自己什么都做不好
今天很糟糕,我复现一篇论文怎么都跑不出来
我发现别人论文疑似数据造假,心态直接崩了
我和我朋友吵架了
我和我对象分手了
我被老师骂了
最近科研把我压得喘不过气来,只想骂人/
##意图名称:placeholder= 科研瓶颈(Academic Challenges)/
##意图描述:placeholder= 针对用户在科研过程中遇到的具体技术 / 实验问题(如复现失败、Loss 不收敛、SOTA 提不上去、过拟合、代码报错、论文被拒等),帮助梳理问题、分析可能原因,并给出可执行的改进方向或替代方案。/
##意图示例:placeholder= 这篇论文我怎么都复现不出来,可能是哪一步有坑?
Loss 一直不收敛,我应该从哪些方向排查?
在小数据集上 Transformer 一直过拟合,有什么办法缓解吗?
结果总是提不上 SOTA,只能持平,还有什么实验可以做?
论文又被拒了,评审说创新性不够,我应该怎么改?
代码总是报错,训练跑不起来,可以帮我一起看看思路吗?/
##意图名称:placeholder= 学术环境与伦理困惑(Ethical & Environmental Concerns)/
##意图描述:placeholder= 当用户对周围的学术环境、竞争压力或学术不端现象感到困惑、愤懑或迷茫(如发现数据造假、被要求不合规操作、对“灌水论文”失望、怀疑自己是否适合留在学术圈),为其梳理利弊与风险,提供更长期、价值观一致的建议与支持。/
##意图示例:placeholder= 我发现一篇顶会论文可能有数据造假,我开始怀疑这行的意义
导师暗示我可以“美化一下结果”,我不知道该不该照做
身边的人都在刷论文数量、灌水,我认真做实验觉得自己很傻
看到这么多低质量论文都能发,我开始怀疑自己要不要继续做科研
大家都在卷,我感觉不跟着卷就会被淘汰,但又很抗拒这种环境/
- 腾讯元器提供了智能体一键优化

- 简单的智能体意图测试流

- 测试结果,可以看到智能体可以准确的输出我们的意图,简单的工作流也搭建完成了


最后,我们可以通过嵌套工作流的方式来完成复杂工作流的编排,替换掉简单的输出。

五、发布智能体
最后,智能体完成后可以通过发布来分享我们的智能体。

六、总结
在智能体盛行的时代,我们需要懂得如何搭建一个符合我们业务场景的智能体,而腾讯元器也正好提供了这一平台,支持我们搭建丰富的智能体,提供了众多的MCP服务以及API,还可以直接使用其他用户发布的智能体,提高我们的工作效率。
7783

被折叠的 条评论
为什么被折叠?



