自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 豆包PixelDance指南:字节跳动推出的AI视频生成大模型,突破多主体互动难关

豆包PixelDance是由字节跳动推出的一款AI视频生成大模型,它基于DiT架构设计,能够实现多风格和多比例的一致性多镜头生成。PixelDance代表了视频生成技术的新突破,支持多主体间的复杂交互和动作指令,具备强大的动态效果和丰富的运镜能力。

2024-10-11 21:33:14 666

原创 Emu3:北京智源推出AI多模态世界模型,超越DeepMind和微软,刷新了8项性能指标

Emu3是由北京智源人工智能研究院推出的革命性多模态AI模型,它采用自回归技术路径,能够统一处理图像、视频和文本数据。Emu3通过将内容转换为离散符号,并使用单一的Transformer模型预测下一个符号,简化了模型架构。它在图像生成、视频生成、视频预测和图文理解等多个方面展现出色性能,超越了多个领域的专用模型。

2024-10-11 10:40:51 850

原创 Meta Movie Gen,赶超Sora,AI视频开启300亿参数的沉浸式叙事时代

Meta Movie Gen是Meta公司推出的一款基于人工智能的视频和音频生成模型,它利用Transformer架构和大规模参数化模型,能够通过文本描述生成视频,编辑现有视频,以及将个人图像转化为视频。这项技术结合了图像、视频和音频模态,使用户能够通过简单的文本输入来创作视频内容。

2024-10-08 20:09:33 1108

原创 超越GPT-4的视觉与文本理解能力,开源多模态模型领跑者 - Molmo

Molmo AI介绍及如何使用的指南,是由艾伦人工智能研究所推出的一系列先进多模态模型,提供图像理解和文本分析的卓越能力。这些开源模型不仅在性能上超越了GPT-4等商业模型,还通过创新的数据收集方法实现了更准确的图像描述生成。

2024-10-08 20:02:44 835

原创 ComfyUI+Krea免费利用AI制作网站萌宠IP,五步搞定制作AI萌宠

Meo喵,一只融合了力量与智慧的猫咪AI工具专家,以其独特的3D风格和精致的设计细节,成为AI艺术创作领域的新星。本文详细介绍了Meo喵形象的创作过程,从初步草图到最终的高清成品,每一步都体现了AI技术与创意设计的完美结合。通过使用先进的AI工具和软件,Meo喵的形象不仅展现了艺术的多样性,也展示了AI在创意产业中的无限潜力。

2024-09-07 12:52:19 1547 1

原创 AI艺术创作福利:免费领取红包封面,Meo喵、龙小金与你共庆佳节!

庆祝佳节,我们网站利用AI工具Midjourney、ComfyUI特别推出1588个独家设计的微信红包封面,免费领取!这些红包封面由AI艺术创作和专业设计团队精心打造,融合了龙小金的吉祥寓意和Meo喵的可爱形象,为你的节日祝福增添独特魅力。每个用户限领一个,先到先得。

2024-09-06 11:58:35 542

翻译 2024上半年全球AI应用Top100排行榜,揭示AI应用新趋势

深入分析了AI应用市场的最新动态。报告显示,创意工具领域以52%的占比成为网络榜单的领头羊,尤其是音乐和视频生成工具的崛起引人注目。移动设备上,图像和视频编辑应用占据22%的市场份额,显示出消费者对移动创意工具的强烈需求。此外,AI助手如ChatGPT和Perplexity在网络和移动平台上的持续流行

2024-08-22 19:56:51 184

原创 多模态学习Multimodal Learning:人工智能中的多模态原理与技术介绍初步了解

多模态学习指的是通过同时利用多种模态的数据进行学习和推理的过程。例如,在图像分类任务中,除了使用图像数据,还可以结合文本描述,以提升分类准确性。多模态学习的目标是利用不同模态的信息,提高模型的泛化能力和表现。模态(Modality)是指信息或数据的不同表现形式。文本(Text):自然语言文本,如文章、评论、对话等。图像(Image):静态图片,如照片、图画等。音频(Audio):声音信号,如语音、音乐等。视频(Video):动态影像,如电影、视频剪辑等。

2024-08-20 18:02:23 1075

原创 预训练(Pre-training),人工智能领域的预训练是什么——AI教程

预训练是指在一个大规模的通用数据集上对模型进行初步训练,使其能够学习到丰富的特征表示。这个过程通常在没有监督(即没有明确的标签)的情况下进行,称为无监督预训练。经过预训练的模型可以捕捉到数据中的模式和结构,从而在后续的特定任务(如分类、回归等)中更有效地进行微调(fine-tuning)。

2024-08-14 16:45:15 1760

原创 一言难尽,听了豆包AI生成的音乐,侵权?Or惊喜?

豆包AI音乐生成功能上线,试听了官方给的AI音乐,发现生成的音乐与大张伟、胡夏等知名歌手风格或声音相似,表达音乐版权和AI生成音乐版权归属的感想。

2024-08-10 23:15:00 1237

原创 FunAudioLLM:阿里通义实验室的开源语音大模型项目 - SenseVoice与CosyVoice模型介绍

深入了解FunAudioLLM,阿里巴巴通义实验室开源的先进语音技术项目。SenseVoice和CosyVoice两大模型,以其高精度多语言语音识别、情感辨识和自然语音生成能力,引领语音交互的新时代。本文详细解析了技术原理、社区开发资源,为语音技术爱好者和专业人士提供了指南

2024-08-09 20:01:29 1932

原创 Paints-Undo:图片生成绘画过程,AI解锁逆向绘画与艺术行为分析新领域

Paints-Undo是一项创新的AI技术,它通过模拟数字绘画的逆向步骤,为我们理解和重现绘画过程提供了全新视角。这项工具通过分析和模拟人类绘画行为,为洞察创意过程提供了深度视角,覆盖从初步草图到最终完善的每一个环节。依托其先进的神经网络架构,Paints-Undo为生成详尽的绘画过程视频、激发创造力、推动艺术教育提供了强大的平台。探索Paints-Undo如何转变你的数字艺术创作方式,并在艺术表达中发掘新的可能性

2024-08-08 10:03:12 864

原创 2024年最新免费AI大模型API汇总及国内大模型使用教程(附代码)

本文汇总了2024年可用的免费大模型API资源,并提供了详细的使用教程,特别是针对国内几款主流的大模型,如讯飞星火、百度千帆、腾讯混元、字节扣子以及硅基流动等。文中不仅列出了各模型的免费使用限制条件,还提供了如何获取API密钥、控制台链接以及API文档的详细指导。此外,还包含了实际代码示例,帮助开发者快速上手并集成到自己的项目中。本文都能为您提供有价值的参考和指导。

2024-08-07 11:46:09 6504

原创 Stable Fast 3D技术解析 - Stability AI推出0.5秒将图片转为3D模型

Stable Fast 3D技术以其突破性的AI算法,将3D资产生成速度提升至0.5秒,为游戏开发者、虚拟现实创作者及零售行业带来革命性变革。一同挖掘技术内核,体验前所未有的设计流程加速,从单张图片到逼真3D模型的飞跃

2024-08-06 11:26:45 1265

原创 免费替代Midjourney!FLUX.1使用方法大全,支持ComfyUI

FLUX.1是由Black Forest Labs推出的开源AI图像生成模型,由Stable Diffusion原班人马打造,该模型拥有12B参数,包含三种版本:FLUX.1 [pro]、FLUX.1 [dev]和FLUX.1 [schnell]。还介绍了核心技术和4种使用教程。

2024-08-05 16:11:14 2851 6

原创 全面认识AI Agent:从感知到行动的智能体架构指南 | MeoAI

本文深入探讨了AI Agent的核心技术和架构,揭示了智能体如何在复杂环境中实现自主交互。从基础的感知机制到高级的规划策略,再到记忆系统的构建和工具的使用,文章全面覆盖了AI Agent的关键组成部分。特别地,我们讨论了大型语言模型(LLM)在智能体决策过程中的应用,以及它如何增强智能体的自然语言处理能力。无论是对AI领域的研究者还是对智能技术感兴趣的读者,本文都提供了一个全面的AI Agent理解和应用的视角。

2024-07-13 16:37:51 1265

原创 情感分析(Sentiment Analysis)

情感分析(Sentiment Analysis),也称为意见挖掘(Opinion Mining),是自然语言处理(NLP)领域中的一个重要分支。它涉及识别和提取文本数据中表达的情感信息。情感分析通常用于理解人们对某个主题、产品或服务的态度,从而提供有价值的洞察,帮助企业和组织做出更明智的决策。

2024-07-04 10:32:55 1184

原创 Sora视频生成技术详解-AI教程

Sora技术代表了AI在视频生成领域的最新成就,它不仅为创意产业带来了新的可能性,也为我们提供了对AI未来潜力的一瞥。随着技术的不断发展和挑战的克服,我们有理由相信Sora将成为推动社会进步和创新的重要力量。我们期待着Sora技术的成熟和普及,以及它在未来社会中的广泛应用。

2024-07-03 22:20:18 1309

原创 MeoAI:全网最全的AI导航网站,5000+AI工具,整理全网的免费AI工具

MeoAI,最高效全面的工具集合网站,5000多个AI工具网址。每日更新和添加最新AI工具。MeoAI工具导航网站,收录了国内外个不同类型的AI工具。

2024-06-18 16:54:02 1086

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除