![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
AI
文章平均质量分 94
T1.Faker
此人很懒,什么都没有写
展开
-
AI Agent 热门的10篇论文
基于智能多智能体系统(MAS)的学习结合了从环境中收集信息、识别数据、智能分类数据和预测未来数据、存储数据、将数据传递到知识管理系统(如决策支持系统(DSS)和管理信息系统(MIS))的过程。这篇论文探讨了现有的多智能体系统研究,并确定了尚未充分解决的挑战。这篇论文讨论了多智能体系统(MAS)的结构及其组成部分,强调了智能多智能体系统在各种研究领域中的潜力,特别是在支持机器学习模型的虚拟环境中。这篇综述对基于大语言模型(LLM)的多智能体系统的基本方面进行了深入讨论,包括这些智能体模拟的挑战、领域和环境。原创 2024-06-11 11:05:32 · 530 阅读 · 0 评论 -
用ControlNet+Inpaint实现stable diffusion模特换衣
删除任何内容填充任何内容替换任何内容删除任何3D删除任何视频- 点击一个对象- 点击一个对象- 点击一个对象- 单击源视图的第一个视图中的对象- 点击视频第一帧中的对象- 分割模型SAM将对象分割出来- SAM将目标分割出来- SAM将目标分割出来- SAM将对象分割出来(使用三个可能的掩码)- SAM将对象分割出来(使用三个可能的掩码)- 修复模型填补“窟窿”- 输入文字提示- 输入文字提示- 选择一个掩码- 选择一个掩码。原创 2024-05-24 16:29:02 · 811 阅读 · 1 评论 -
Wav2Vec 2.0:语音表示自监督学习框架
Wav2Vec 2.0是目前自动语音识别的模型之一。Wav2Vec 2.0 代表了无监督预训练技术在语音识别领域的重大进步。这些方法通过直接从原始音频中学习,无需人工标记,因此可以有效利用大量未标记的语音数据集。相比于传统的监督学习数据集通常只有大约几百小时的标记数据,这些新方法已经能够扩展到使用多达 1,000,000 小时的未标记语音进行训练。在标准基准测试上进行微调后,这种方法在低数据环境中特别显著地提升了现有技术的表现。原创 2024-05-23 11:32:12 · 1109 阅读 · 0 评论 -
GPT-4o:全面深入了解 OpenAI 的 GPT-4o
OpenAI 推出了最新的人工智能模型 GPT-4o,这是一项突破性的开发成果,将文本、语音和视觉功能集成到单一、无缝的人工智能体验中。GPT-4o 于 2024 年 5 月 13 日发布,其中“o”代表“omni”,它将彻底改变用户与 AI 交互的方式,使体验比以往更加自然和直观。原创 2024-05-14 14:38:49 · 1403 阅读 · 0 评论 -
生成式AI - 关键技术历史和发展
生成式模型在人工智能领域有着悠久的历史。隐马尔可夫模型(Hidden Markov Models,HMMs)和高斯混合模型(Gaussian Mixture Models,GMMs)是在上世纪50年代首次开发出来的。这些模型生成了序列数据,如语音和时间序列。然而,生成式模型直到深度学习的出现后才取得了显著的性能改进。原创 2023-06-15 15:05:15 · 1171 阅读 · 0 评论