- 博客(462)
- 收藏
- 关注
原创 一文讲透多智能体框架 Open Manus | 全网独家深度解剖,代码级讲解它背后隐藏的秘密
prompt/目录中的内容,虽然不涉及具体的代码实现,但却在open_manus的智能体行为决策中起到了 至关重要的作用。Manus关注工具调用,确保任务执行的高效性。负责任务分解,优化任务规划和调整能力。SWEAgent专注于代码执行,确保 Shell 交互和代码编辑的准确性。这些 Prompt 定义了各个智能体的行为边界,使得open_manus能够在不同的任务场景下表现出合理的智能决策能力。接下来,我们将深入解析tool/文件夹,了解open_manus。
2025-03-19 22:03:33
3841
原创 【直观对比】RTX3090和RTX4090的计算能力的参数对比
随着大模型的火热,越来越多的人希望可以购买一个硬件进行大模型的推理,特别是在3090和4090显卡的对比上,需求比较大。目前已有的显卡对比,大多面向于和,如图所示。但是,对于消费级的显卡的计算能力的参数对比还比较少,更多的是对比游戏或者跑分的。由于工作需要,特地辗转了多方网站,整理了3090和4090的性能参数对比图,附带A100的参数用于衔接。从表中可以看出,在目前最常用的FP16上,4090和A100是一样的。也就是说,如果只是部署一个7B的模型,并且开了FP16,那么两者的推理速度应该是大致相同的。
2024-05-11 15:24:16
39218
原创 一文掌握大模型数据准备、模型微调、部署使用全流程
距离ChatGPT已经发布1年半了,距离我们训练出自己的大模型也已经1周年了。目前仍然有很多同学在咨询如何训练自己的大模型。这个东西和男/女朋友一样。当你不认识TA,距离TA很远,不敢接触TA的时候,TA就是很神秘,也很难接触。但是一旦当你愈发了解TA的时候,你就知道其实上手也很容易。之前我已经撰写了一个简单的训练大模型的代码,用于阐述大模型训练其实和原来的训练没什么两样。但是随着大模型深入到了每一个研究者的
2024-04-27 22:52:25
19988
原创 一文讲清chatGPT的发展历程、能力来源和复现它的关键之处
chatGPT是什么?这可能是最近被问的最多的一个。大家第一反应这应该是GPT系列的一个最新模型,普通大众可能更愿意把它看做是一个人工智能。实际上,它其实就是一个基于大规模语言模型的对话系统产品。官网对它定义十分的明确:Optimizing Language Models for Dialogue.最大的问题在于,它的背后究竟是一个什么?很多人都以为,chatGPT是一个单一模型,就如同GPT-1/2一样,应该是一个可以被加载和训练的。
2023-02-12 16:46:16
43151
19
原创 科研论文撰写相关工具一条龙服务指南
我们科研论文撰写过程需要很多注意的部分,例如,选择撰写平台、latex的图表的设计和制作,为自己的模型起一个名字,英文写作,还有参考文献的搜集和整理,以及适合的投稿会议候选等。本文将一条龙的介绍下去,保证科研论文撰写中遇到的主要困难都能够得到很好的解决。
2021-11-30 18:23:56
1395
1
原创 学术会议演讲视频录制全方位指南
1. 引言随着进入后疫情时代,在线学术会议愈发频繁。从CCF-A类会议到C类会议,基本上都需要做线上的Oral。一般的要求就是录制一个15分钟左右的Presentation,然后上传至网站即可。有些会议还贴心的准备了加载字幕的功能,我们的英语水平基本都是有自知之明的,所以如果想让别人更好的理解我们的想法,建议增加手工字幕(自动字幕都是自动识别的,但是性能堪忧)。接下来,我们将介绍一个完整的演讲录制过程。2. 录制视频对于视频的录制,基本上会议都有一定的要求,例如要求16:9的视频以及PPT,清晰度
2021-05-29 21:46:44
7646
2
原创 惊艳于红警开源代码?赏心悦目的代码注释,我们也可以 !
这几天,红警1的开源代码重现江湖,这个20年前,甚至25年前的代码,被我们所有的后来者所惊叹,这才是一个艺术品一般的存在。那么如果我们也想写出如此优美的代码,应该注意的事项有哪些?本文将讲述3个编码时需要注意的部分,并着重讲解如何编写出规范的代码注释并加以利用。
2020-06-10 13:55:45
34742
52
原创 3年长跑,修成正果
文章目录相遇相识相知相恋相守我和CSDN的故事很短,只有6个字:“人生若如初见”;我和CSDN的故事很长,我要用一生去讲。相遇2014年,我在计算机科学与技术这个曾经“万金油”的苦海里苦苦挣扎时,偶然间遇到了CSDN。无论什么问题,她都会耐心的解答。我需要什么材料,她都能给我帮助。在专业领域中,我感觉到她什么都知道。她的亲切、温柔、耐心、博学,还有她的美丽,让我一见钟情。我自认为自己幸运,...
2019-10-12 21:25:28
2945
27
转载 一文看懂25个神经网络模型
1. 引言在深度学习十分火热的今天,不时会涌现出各种新型的人工神经网络,想要实时了解这些新型神经网络的架构还真是不容易。光是知道各式各样的神经网络模型缩写(如:DCIGN、BiLSTM、DCGAN……还有哪些?),就已经让人招架不住了。因此,这里整理出一份清单来梳理所有这些架构。其中大部分是人工神经网络,也有一些完全不同的怪物。尽管所有这些架构都各不相同、功能独特,当我在画它们的节点图时……其中潜在
2017-06-17 10:26:08
257562
23
原创 【ACL系列论文写作指北20-不同论文类型百花齐放】-论文究竟是什么?
最常见的一类论文,是“发明”一个“东西”:新的模型、新的算法、新的数据集、新的系统,填补某个空白、改进某种现状,或者在既定设定下取得 SOTA。凭我自己的经历来看,一个人真正经历过几轮完整的科研过程之后,往往都会逐渐意识到:论文并不是某种单一的竞赛模板,而是一种长期积累下来的记录与交流方式。如果一个东西本身很好,却没有人能看懂,或者看不懂并不是因为读者能力不够,而是因为作者的表达过于混乱、晦涩甚至自我陶醉,那么无论成果多么耀眼,从知识传播的意义上看,都是对人类智慧的一种浪费。尤其是在我们这个阶段。
2026-01-10 21:14:06
430
原创 学生应当如何被培养?
归根结底,大学教育的根本使命,不在于塑造标准化的人才,也不在于短期内累积量化成果,而在于点燃个体的潜能,塑造其终身成长的内在能力,使每一种不同的人才都能找到适合自己发展的方向。允许人才多样化,是教育的智慧;帮助人才找到合适的位置,是教育的能力;培养贯穿一生的底层素质,是教育真正的使命与价值所在。
2025-11-27 12:48:13
933
原创 [论文解读] TASLP 2025 | 首次实现修辞结构与话题结构的无监督联合建模,开辟对话篇章解析新范式
该研究首次实现了修辞结构与话题结构的无监督联合建模,提出统一篇章结构表示与双层互学习机制,填补了两类结构长期割裂建模的研究空白。UMLF 不仅在五个数据集上超越现有基线,还在 Qwen2 与 Llama3 等大型语言模型上验证了方法的通用性与鲁棒性。其价值在于为多方对话提供了可迁移的篇章解析框架,显著提升模型的语篇连贯性与语义一致性,并为医学咨询、智能客服等需要深层语篇理解的实际场景奠定了基础,推动对话系统向更智能、解释性更强的方向发展。
2025-11-10 09:45:56
769
原创 如何撰写高质量的评审意见 —— 以 AAAI 2026 为例
评审的第一部分应当是对论文的中立总结。你真正理解了这篇论文。主要贡献:用一句话明确论文的核心贡献。核心问题:作者试图解决的研究问题是什么?关键思想:论文提出的核心方法/理念。具体实现:该方法是如何落地的,例如模型设计、实验框架等。研究结论:作者声称得到的主要发现或结果。⚠️ 注意:这一部分要保持中立,不带褒贬。第二部分是对论文的总体评价,通常也是 4–10 句话。第一行需要直接点明你的审稿结论,例如随后,你可以从几个维度展开:清晰度:论文写作是否流畅,表达是否清楚?技术与实验的严谨性。
2025-09-28 11:18:41
1603
原创 《虚拟智能体经济》读后感:从算力、声誉到虚拟社会的治理与公平
读完这份报告,我常常回想三十年前的科幻:《黑客帝国》、《数码宝贝》把数字世界描绘得既可怖又梦幻。今天那样的想象,正在一步步走进现实。数字世界,确实可能成为另一个五彩缤纷的“家园”。我常问自己:我能为AI的发展做什么?很多时候,答案像暗恋:远远注视、在它需要时伸手帮助,也许就足够了。这是我与 AI 的一种不言而喻的约定——既保持理性批判,又怀抱温柔的好奇心。
2025-09-22 19:24:08
1649
原创 科研的秘诀,原来只有这三件事
今天开组会,一个学生问我:“老师,科研的秘诀是什么?我愣了一下。秘诀?如果真有的话,大概并不是某种天才的灵感闪现,而是一些看似朴素但反复被验证的习惯。
2025-08-22 10:51:08
667
原创 NVIDIA RTX PRO 6000 Blackwell 精度算力对比及 LLM 应用分析
方面,如果是大模型的线上服务,需求往往是批量推理吞吐和足够大的显存,RTX 6000 Blackwell 的单卡性能和 96GB 显存非常契合此类需求,可以用于部署 70B 级别模型的加速推理。搜索了一下,好像没有很好的资料,特别是对于其具体的参数上,很多文章都是二手,三手,甚至是洋葱文章,无法做到详细的对比。) 的高带宽 HBM,内存带宽略低。4-bit 量化是更激进的一步,目前主要在研究阶段,难以在不牺牲过多准确率的情况下用于高精度要求的模型推理,更遑论训练过程(训练对数值精度更敏感)。
2025-08-13 09:40:08
24819
7
原创 【ACL系列论文写作指北19-科研中角色定位与自我认知】-如何在一篇论文中摆正自己的位置
科研不是一个人的游戏,但也不能永远站在边上看。愿你在每一个项目中,都能清晰看见自己的位置,也一步步走向你想成为的科研人。
2025-07-18 10:46:41
1121
原创 一文讲清最近2年的多智能体框架以及其5种设计模式
从早期单智能体的孤军奋战,到如今多智能体分工协作、长程记忆、自主反思的百花齐放,AI代理技术在短短两年内经历了飞跃式的发展。我们借助设计模式的视角,对多智能体系统的关键理念进行了梳理:角色扮演带来专家协作,议题协商保障信息共享与决策一致,记忆增强突破上下文局限,工具使用赋予行动能力,动态反思提升自主适应性。这些模式并非彼此孤立,而是常常综合在一个完整系统中共同发挥作用。例如AutoGen、CAMEL等框架就同时体现了多个设计模式,以期打造更"全面"的自治代理。
2025-07-07 14:23:25
4152
原创 【ACL系列论文写作指北18-如何不被时代甩下车】- LLM 时代下的高效科研指南
科研效率,不是“谁更努力”,而是“谁更会安排”。用 LLM 处理能自动化的内容(代码、摘要、草稿)把你的科研项目按阶段拆解,提前准备每个阶段的材料给自己设立一个科学的节奏表,而不是“等模型跑完再动手”大模型是浪潮,不懂它会被它推着走,掌握它才能站上浪头。🎯 如果你觉得这篇文章有用,欢迎转发给你的实验室同伴。你也可以留言分享你在高效科研过程中的方法和工具,我们一起在 LLM 时代成为更快的研究者。
2025-07-07 13:48:14
647
原创 【ACL系列论文写作指北17-如何进行代码协作】-基于 GitHub 的科研代码协作实践指南
科研不是一人闭门造车,而是集体智慧的交汇。代码,也不该是一团糟的“临时产物”,而应该是项目可传承、可复现、可共享的根基。从现在起,从 GitHub 上开一个组织、写下第一个 Issue、提交一个 PR,迈出你科研协作的第一步。👉欢迎将本博客转发给你的实验室/课题组同伴,一起改掉“小作坊开发”的习惯!
2025-07-07 10:33:49
1025
原创 【ACL系列论文写作指北16-如何进行匿名代码提交】一文读懂 Anonymous GitHub 用法 + 自检清单
在 ACL等顶会逐渐鼓励开源复环的背景下,已经成为一项“软性强制”的任务:——你不能不交,但你一旦交了,就不能曝光作者信息。
2025-07-06 22:16:17
2130
原创 【ACL系列论文写作指北15-如何进行reveiw】-公平、公正、公开
越来越多的ACL类会议(ACL、EMNLP、NAACL、Findings等)采用 OpenReview 作为评审平台,这意味着评审过程不仅更公开透明,而且更强调交流与建设性的反馈。在这样的背景下,作为投稿人也逐渐被鼓励参与评审任务,实现“写稿-评稿”双循环。对于很多初次担任审稿任务的学生来说,可能会疑惑:这是不是一份义务劳动?有没有回报?Review不是额外的负担,而是你科研能力成长的加速器。批判性地分析一篇研究的价值和问题;学习前沿方法,开拓思维边界;提出有帮助的修改建议,提升表达能力;
2025-07-05 22:53:26
1523
原创 新装 RTX 5060 黑屏不亮?只需一步设置 PCI-E 为 Gen4 即可解决!
RTX 5060 黑屏问题的根源,往往不是硬件损坏,而是主板 BIOS 设置不当。只需一步将 PCI-E 调整为Gen4 模式,就能轻松解决黑屏烦恼,畅享 RTX 5060 的高能体验。(因为这个问题,跟客服沟通了2个小时都没什么用,也许是机器人在跟我聊,所以总是在循环论证。最后还是依靠自己的电脑知识将其解决了)。
2025-07-03 18:27:14
12700
原创 从零开始,用 GitHub Pages 部署你的第一个静态网页
准备一个你拥有的域名在仓库根目录新建文件CNAME到 DNS 服务商设置 CNAME 记录:类型主机记录值CNAMEwww你的用户名.github.io回到 GitHub Pages 看到绿锁即表示成功启用 HTTPS操作说明静态网页托管GitHub Pages,免费、安全、初学者亲和自动部署支持 git push 后自动生效自定义域名可绑定个人域名并启用 HTTPS适用场景作品集、博客、经历、demo 等。
2025-06-19 15:08:14
1291
原创 【NLP基础知识系列课程-Tokenizer的前世今生第五课】从静态到可学:Tokenizer 的自适应演化之路
Vokenization 是一个跨模态的 token alignment 方法,为每个文本 token 匹配一个“视觉 embedding”,形成“视觉 token”或“voken”。在 NLP 或多模态任务中,我们一直使用固定的分词器(如 BPE、WordPiece)在训练前将文本分为 token。但这是一种静态方式,与模型参数解耦,与任务目标无关。Tokenizer,不再只是“tokenizer”,而是人工智能系统的输入分配器(Input Orchestrator)。是新的 token 表示。
2025-05-27 23:41:37
1114
原创 【NLP基础知识系列课程-Tokenizer的前世今生第四课】生物信息中的 Tokenizer 策略:如何切开一段基因?
控制输入长度,压缩非线性结构显式聚焦功能片段,避免模型注意力稀释引入结构先验或从数据中自学习切分规律正如语言模型需要“分词”,蛋白质语言模型、分子语言模型、甚至交互药理模型,也需要找到它们的“词语单位”。Tokenizer,不再是文本处理的工具,而是知识结构的剪刀。未来,它将进一步融入结构建模、信号表达、合成建模任务中,成为生物智能系统的“语言入口”。
2025-05-27 23:26:45
1088
原创 【NLP基础知识系列课程-Tokenizer的前世今生第三课】多模态世界中的 Tokenizer 策略
一个优秀的多模态 tokenizer,不只是“切词工具”,而是跨语言与感知之间的桥梁。一个模态压缩器(compressor)一个语义对齐器(aligner)一个结构提示器(structurer)tokenizer 与 encoder 融合为模态感知引擎动态感知上下文,灵活生成 token 序列从统一序列转向多模态图结构 token 表示下一篇,我们将走入非语言符号世界:基因、蛋白质、分子结构等生物序列,那些没有自然语言规律却承载复杂规则的序列,又该如何“切”?
2025-05-27 23:15:33
1344
原创 【NLP基础知识系列课程-Tokenizer的前世今生第二课】NLP 中的 Tokenizer 技术发展史
Tokenizer 不只是为了节省长度、提升效率,更是为了让模型对语言有更深入、系统的建模方式。今天的 tokenizer,已经从“静态规则”演进到“可学习模块”;从“辅助工具”升级为“认知中介”。而随着语言模型不断演进,我们也逐渐意识到:Tokenizer 不应当是障碍,而应当是助力。下一篇,我们将走进多模态时代的 tokenizer:图像、音频、视频、表格……这些非文本的输入,又是如何“被切”的?又如何与文本 token 融为一体?敬请期待。
2025-05-27 23:04:28
1106
原创 【NLP基础知识系列课程-Tokenizer的前世今生第一课】Tokenizer 是什么?为什么重要?
当你读到“unbelievable”,你可以立刻意识到它是“un + believe + able”构成的,这种构词结构能让你快速理解它的意思。这个单位,就叫做 token,而设计这个单位的方式,就是 tokenizer。”,模型可能就要花更多精力才能拼凑出“哦,这是一个否定+动词+形容词构成的词”。我们可以看到,从语义结构最强的“句子”到最原始的“字节”,Tokenizer 划分的单位越小,信息越精细,但模型所承担的“组合理解”任务也越大。细了,理解变得困难。除了“切多大”,另一个问题是“怎么切”。
2025-05-27 22:49:24
961
原创 在 Linux 系统上连接 GitHub 的方法 (适用2025年)
在2025年,使用 Linux 系统连接 GitHub 的推荐方式是通过 SSH (Secure Shell) 协议进行身份验证。这种方式不仅安全,还能免去每次操作时输入用户名和密码的繁琐。
2025-05-27 17:04:52
4178
原创 【计算机哲学故事2-1】进程与线程管理:专注比盲目忙碌更重要
我顿了顿,继续说道:“所谓‘一心多用’,其实只是快速切换,表面风光,内耗巨大。”我点头,“聪明的人,不是硬撑着开无数线程,而是清楚知道:什么时候该聚焦主进程,什么时候该暂停后台干扰。“进程,就像人生里的不同大领域——工作、学习、生活、情感,每个进程独立运行,切换一次进程,成本很高。“而线程,是在同一个进程里的细节任务,比如在‘工作进程’下,你同时开着回邮件、查资料、听电话,这些才是线程。我递给她一杯水,笑着提醒:“记住啊,遇到琐事缠身,别忘了启动死锁检测,及时清理,别让自己崩溃了。我笑了笑:“你知道吗。
2025-05-25 16:59:06
486
原创 【计算机哲学故事1-6】备份机制:给重要的人和事留“后路”
我笑着说,“只留那些真正改变过你生活的瞬间,比如你第一次一个人旅行的自拍,第一次夜里崩溃后给朋友发的语音,那些东西,不该被系统清理掉。我指了指窗外:“你有没有想过,其实我们人生中最怕的,不是痛快告别,而是到了下一个地方,突然想找点什么,却发现早就删了,连个备份都没留。”她低头看着屏幕,片刻后,点开了“iCloud照片”,勾选了几张不知名的截图,还有一个备注为“再看一次”的语音。”她抬眼看了我一眼,像听到老生常谈:“又来了。那就是全量备份的对立面,一刀切,空间确实省了,但有些东西删了就是没了,没法恢复。
2025-05-17 14:26:43
399
原创 【计算机哲学故事1-5】版本更新:拒绝停滞,成长是最好的修复
她低头看着手机,手指在屏幕上划来划去,像是在回顾这几年没点下去的“升级”。”她侧头瞪了我一眼,懒洋洋地说:“好啦好啦,我又不是不知道,你讲它的次数都比提起我的次数还多了。忽然,她皱起眉头,嘟囔了一句:“又弹更新提醒了,这破系统一天到晚催我升级,真烦。”她撇撇嘴:“用得好好的,干嘛非得更新?她看着手机屏幕,沉默良久,最终还是轻轻一笑,果断地点下了“立即更新”。”我也笑了:“人生没有完美版本,但持续优化,才是最好的修复。”我笑了笑,“那时候没人问你愿不愿意,直接推送——升学、考试、毕业,系统自动迭代。
2025-05-14 13:34:48
423
原创 全景系统监控利器:Glances 使用介绍与实战指南
Glances 是一款基于 Python 的跨平台系统监控工具,可以在命令行中以全景式视图展示系统资源使用情况。它的核心理念是 “少即是多(Less is more)”,在一个屏幕中集中展示最重要的信息。CPU 使用率(整体与每个核心)内存、Swap 使用率磁盘 I/O 情况网络传输速率系统负载 Load Average活跃进程列表(PID、CPU、MEM 等)支持 Docker 容器、RAID 状态、GPU、温度等插件扩展SSH 登录远程服务器时实时监控。
2025-05-13 15:52:56
1147
原创 【计算机哲学故事1-4】权限控制:动态分配角色,守护你的核心世界
我笑着答道,“只授予完成任务所需的最低权限,干完就撤销,动态管理,绝不留死角。朋友也分层,有的只能‘只读’,有的可以‘评论’,真正亲密的,才配‘编辑权限’。”她语速飞快,像是在清点一天的情绪账单,“关键是,这些事根本不关我的事,可我总觉得,拒绝了好像很冷漠,不帮又觉得心累。”我枕着手,望着天花板,“我本科做EMP系统的时候,第一次接触到RBAC——基于角色的访问控制。我微微一笑,顺着她的话说道:“嗯,权限管理,不是为了隔离世界,而是为了守住自己的核心。好啦,你的号我现在已经封了,睡觉吧。
2025-05-09 09:59:01
419
原创 【计算机哲学故事1-3】默认设置:在有限的系统里,决定你想成为什么
我指了指屏幕上的桌面,“虽然开机默认都长一个样,但从这一刻开始,你有了自定义的空间。”我点头,“提了权,才有资格去管理那些系统默认塞给你的‘程序’——比如社会标签、他人期待、无效焦虑。”我回答,“深度自定义从来都是有风险的。她盯着屏幕上熟悉的蓝色窗户,语气里透着一丝无奈:“我发现,不管买多少次新电脑,开机那一刻,看到的永远是同一张桌面。我点头:“真正的自由,是在你改不了的BIOS下,敢于掌控操作系统,卸载不需要的预设,装上自己想要的人生程序。她笑着推了我一把,目光坚定地开始操作她的“人生桌面”。
2025-05-08 17:15:11
390
原创 github之高效团队协作:GitHub 项目分支管理与协作全指南
一个结构清晰、规范明确的 GitHub 协作流程,能大幅度提升团队的开发效率和产品质量。从项目结构到分支策略,从 CI/CD 到代码审查,再到成员分工和敏捷协作,全面打造专业、高效的团队协作环境。如果你的团队刚刚起步或尚未规范协作方式,现在正是建立这一体系的最佳时机。
2025-05-06 17:21:24
1764
原创 【ACL系列论文写作指北14-科研心态与抗压管理】-走得远,比走得快更重要
科研是一场持久战,胜负从来不取决于一时的得失,而在于谁能笑到最后。愿你在面对每一次拒稿、每一个深夜未果的实验时,都能告诉自己:“这很正常,我会变得更强。无论风雨,始终向光而行。
2025-04-28 13:23:46
1047
原创 【ACL系列论文写作指北13-科研方向把控】-从选题到格局
❌ 跟风热点,忽略自身优势。❌ 方向散乱,缺乏主线思维。❌ 只盯短期论文,缺少长期科研布局。
2025-04-28 13:17:59
1189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅