
LLM
文章平均质量分 93
寸先生的牛马庄园
专注AI,热爱文学
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Transformers without Normalization解读
2025年3月13日,由何凯明和Yann LeCun领衔的论文Transformers without Normalization挂载Arxiv上,大佬论文必须读一下。本文就该论文进行一个简单总结。原创 2025-03-17 08:53:59 · 895 阅读 · 0 评论 -
AI作曲DiffRhythm原理及本地部署
最近AI在音乐生成方面的进展引起了极大的关注,但现有的方法面临着严重的限制。一些当前的生成模型只能合成人声或伴奏轨道。虽然一些模型可以生成组合的人声和伴奏,但它们通常依赖于精心设计的多阶段级联架构和复杂的数据管道,阻碍了可扩展性。此外,大多数系统仅限于生成短音乐片段而不是全长歌曲。此外,广泛使用的基于语言模型的方法受到推理速度慢的困扰。DiffRhythm是第一个基于潜在扩散模型的歌曲生成模型,能够在短短 10 秒内合成具有人声和伴奏的完整歌曲,持续时间长达 4m45s,保持高音乐性和可理解性。原创 2025-03-14 17:28:39 · 1407 阅读 · 0 评论 -
Gemma 3简介与部署
发布背景:Gemma 3 是2025年3月12日谷歌在之前发布的 Gemma AI 模型基础上的升级之作,基于 Gemini 2.0 技术打造。模型规模:提供了四种不同尺寸的模型,分别是 1B、4B、12B 和 27B,以满足不同硬件性能的需求。原创 2025-03-14 08:21:24 · 3614 阅读 · 0 评论 -
CAMEL-AI OWL部署测试
技术原理上,OWL 通过动态智能体交互实现高效的任务自动化,强调智能体之间的协作模式和通信协议,并基于 CAMEL-AI 框架开发,大语言模型(如 OpenAI 兼容模型)作为智能体的核心能力。实测一下,还是比较费Token的,而且如果遇到网站反爬之类的还会有问题,Manus没有用过没有发言权。至少对比了openManus和OWL,感觉这个是Agent的曙光,但是真的使用,速度慢,费用较高,还有很大提升改进空间,个人觉得至少在目前,全自动可能还不太好用,人机协同会更好。文件,接入所需的 API 服务。原创 2025-03-10 20:51:50 · 1954 阅读 · 0 评论 -
OpenManus介绍及本地部署体验
OpenManus,由 MetaGPT 团队精心打造的开源项目,于2025年3月发布。它致力于模仿并改进 Manus 这一封闭式商业 AI Agent 的核心功能,为用户提供无需邀请码、可本地化部署的智能体解决方案。换句话说,OpenManus 就像一位全能的数字助手,能够在你的本地设备上运行,随时听候差遣,完成各种复杂任务。它的出现,打破了技术领域的高墙,让每一位开发者都有机会站在同一起跑线上,快速实现诸如代码生成、数据分析、网络信息检索等复杂任务的自动化处理。原创 2025-03-09 10:28:07 · 27760 阅读 · 9 评论 -
QWQ-32B概述与本地部署使用
2025年3月5日,阿里巴巴千问QwQ-32B,即DeepSeek之后,中国AI大模型有一次震惊世界。QwQ-32B 的运行成本显著低于 DeepSeek-R1 等模型,性能更优,成本仅为 1/10,体现了我国在被外国技术封锁的情况下进行进行自主创新的能力。QwQ 是 Qwen 系列的大模型之一,专注于 推理能力(reasoning)。原创 2025-03-08 10:27:32 · 2522 阅读 · 0 评论