自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(399)
  • 收藏
  • 关注

原创 炸裂!Stability AI 偷偷发布黑科技,Sora、可灵视频配音神器来了!

简单来说,就是用文字就能生成各种音频,什么鼓点、旋律、环境音效,统统不在话下!Stable Audio Open 支持动态加载模型,你可以随时换着用,体验不同的风格和效果!自带随机提示按钮,专治各种灵感枯竭,妈妈再也不用担心我写不出好 Prompt 了!内置 BPM 和节拍选择器,精确控制音乐节奏,再也不用担心跟视频节奏不匹配了!这音效,这节奏,简直就是专业级别的!自动剪辑音频到指定长度,方便导入各种音乐软件,省时省力!,不用配置环境,不用担心隐私泄露,下载就能用!8G 显存以上英伟达显卡。

2024-08-18 12:04:57 241

原创 重磅!Argos Translate 开源翻译神器来袭!30+ 种语言,离线也能翻,再也不怕泄露隐私啦!

Argos Translate 是一款功能强大、使用便捷的翻译神器,无论是个人用户还是开发者,都能从中受益。还在犹豫什么?赶快下载体验吧!悄悄告诉你,这款神器还能帮助你学习外语哦!怎么样,是不是很心动?

2024-08-15 21:11:10 321

原创 爆火的AI直播换脸应用Deep-Live-Cam整合包来了!6G显存可跑!

嘿,朋友们!最近AI圈又炸了,一个叫Deep-Live-Cam的神器突然火了。这个工具简直让人惊掉下巴,它可以实时换脸,还能一键视频深度伪造!只要一张图片,就能把一个人的脸换到视频或其他图片上,简直是视频制作和动画创作的福音啊!

2024-08-11 15:54:26 725

原创 绝绝子!打字就能P图,Diffree一键P图整合包

Diffree是一个基于AI的创新图像编辑工具,通过简单的文字描述即可实现图像编辑和创作。你无需具备专业的图像编辑技能,也无需进行复杂的操作,只需通过文字描述想要添加或修改的对象,Diffree的AI就能理解并执行这些指令,自动完成图像编辑工作。Diffree作为一个AI驱动的图像编辑工具,无疑为图像编辑领域带来了革命性的变化。它通过简化操作流程,提高编辑效率,同时保证图像质量,为用户带来了全新的创作体验。

2024-08-08 10:24:14 784

原创 还得是清华,开源版可灵、Sora AI视频生成整合包!

随着人工智能技术的飞速发展,视频生成已经成为现实。今天,我们有幸介绍一个令人兴奋的开源项目——,由清华大学团队开发,它将文本转换为视频的能力带到了一个新的高度。

2024-08-07 20:31:08 874

原创 STK 11.6软件安装教程,附软件包及学习资料!

大家好!今天要给大家介绍的是一款在航天领域炙手可热的分析软件——STK!由美国Analytical Graphics公司开发的STK,是一款功能强大的商业分析软件,广泛应用于航天任务的全过程,包括设计、测试、发射、运行和任务应用。STK不但拥有强大的分析引擎,能够计算各种数据,还能显示多种形式的二维地图,展示卫星和其他对象如运载火箭、导弹、飞机、地面车辆、目标等的状态。STK的核心能力在于产生位置和姿态数据、获取时间、遥感器覆盖分析。

2024-08-06 17:06:21 834

原创 关掉MidJourney! Stable Diffusion开源模型之王FLUX.1整合包分享!

FLUX.1是一个拥有120亿参数的庞大模型,是目前最大的开源文本到图像模型之一。它包含三种变体:专业版[pro]、开发版[dev]和快速版[schnell],以满足不同用户的需求。

2024-08-05 22:51:34 464

原创 太强了,图片无限放大!AuraSR整合包来了!

大家好!今天我要给大家安利一个超级厉害的工具——,它是从GigaGAN论文中衍生出来的神奇上采样模型,拥有6亿参数,完全开源。AuraSR不仅能将图片放大四倍,还能补充每一个细节,甚至可以重复进行放大处理。无论是从演示效果还是实际使用体验来看,AuraSR都表现得相当出色,速度也非常快,非写实内容同样可以处理。

2024-08-05 14:08:00 394

原创 无需训练,人人都是艺术家,一键AI生成风格化图像!

简单来说,Artist是一个无需训练的文本驱动图像风格化方法,由songrise团队开发并维护。它的核心是一个预训练的Stable Diffusion模型,用户只需提供一张图片和想要的风格描述,Artist就能自动生成风格化的图像。最棒的是,这个过程完全不需要额外的训练或下载任何特定的网络结构,如ControNets或LoRAs,使用起来超级方便!

2024-08-04 10:11:53 418

原创 牛逼,阿里出品!带情感识别的多语言快速语音识别模型

大家好,今天我要给大家介绍一个超级牛的技术——阿里巴巴最新推出的SenseVoice模型!这个模型不仅可以进行多语言语音识别,还能识别情感,甚至能检测各种声学事件。简直是音频处理界的全能选手!让我们一起来看看它到底有多强大。

2024-08-02 09:34:37 354

原创 配音员要失业!AI一键生成视频配音!

FoleyCrafter 不仅提升了无声视频的观看体验,也为视频制作者提供了一个强大的工具,让他们能够更加专注于创意和内容本身。随着技术的不断进步,我们有理由相信,未来的声音合成将更加智能和个性化。

2024-07-30 20:17:11 407

原创 PhotoMaker V2,几张照片生成奥运风写真!

如果你还不知道PhotoMaker,那你可真是错过了一个神器!PhotoMaker V2通过堆叠ID嵌入,可以在几秒钟内完成个性化的人物图像定制,而且无需额外的LoRA训练。你只需要输入几张自己的照片,然后通过提示词或者其他的参考图像,就能生成自己在各种场景、各种状态、各种风格的照片!

2024-07-29 21:07:44 281

原创 只要8G显卡!本地运行最强Llama 3.1大模型!

前几天,Meta发布了他们迄今为止体量最大的开源AI模型——Llama 3.1。这个模型在多项基准测试中表现卓越,甚至优于GPT-4o和Anthropic的Claude 3.5 Sonnet。这次发布的Llama 3.1有三个尺寸:8B(中杯)、70B(大杯)和 405B(超大杯)。相比几个月前发布的小型Llama 3模型,Llama 3.1复杂得多,能力更强。

2024-07-28 20:56:29 485 1

原创 Mac批量图片无损方法神器Final2x分享

Final2x还有一个超级棒的功能,那就是自定义Scale。你可以灵活指定图像的放大倍数,实现更精细的超分辨率效果。这就像是你手中的放大镜,可以随意调整放大倍数,看到更多细节。Final2x不仅仅是一款软件,它代表了图像处理技术的新趋势。随着技术的不断进步,我们有理由相信,Final2x将会在图像超分辨率领域发挥更大的作用,为用户带来更加清晰、生动的视觉体验。所以,赶紧去试试Final2x吧,让你的每一张图片都焕发新生!

2024-07-23 23:11:21 381

原创 ​Mac版LivePortrait来了,一键人物表情迁移!

最近,快手开源了一项名为LivePortrait的技术,这在人工智能领域引起了广泛关注。通过深度学习模型,它能够将一个人的面部表情和姿态迁移到另一个人的面部上,实现实时的动态效果。这项技术的应用前景非常广泛,包括但不限于视频编辑、增强现实(AR)、虚拟现实(VR)等领域。LivePortrait不仅在GitHub上获得了6.6K的Star,还登上了HuggingFace Space榜首,成为Papers with code榜一和HuggingFace所有主题排行榜一。

2024-07-23 23:02:06 325

原创 可灵本地平替,阿里发布视频生成工具EasyAnimate

阿里云大数据AI团队一直致力于推动技术创新和实战应用,EasyAnimate-v3的发布是这一努力的最新成果。我们期待看到它在视频生成领域的广泛应用和创新。如果你有任何问题或建议,欢迎在评论区与我们交流!

2024-07-22 10:46:57 538

原创 Mac免费语音合成APP EmotiVoice,网易出品!

在人工智能的浪潮中,网易有道AI算法团队精心打造并向公众开源了一款国产TTS语音合成引擎——EmotiVoice。自上线以来,仅用一周的时间便以4200颗星的耀眼成绩,荣登GitHub trending流行榜首。EmotiVoice不仅是一个功能强大的开源TTS引擎,更以其支持中英文双语、超过2000种独特音色的丰富库存,以及创新的情感合成功能而备受推崇,能够合成包括快乐、兴奋、悲伤、愤怒等多种情感色彩的语音【文后获取下载地址】。

2024-07-20 16:42:09 252

原创 神器!一键秒替换任何物体背景整合包

这款快速抠图工具真的非常强大,不管是用于个人使用,还是专业需求,都能极大提高工作效率。感兴趣的小伙伴赶紧下载试试吧!

2024-07-14 21:47:55 281

原创 阿里开源数字人EchoMimic,支持长视频!

EchoMimic的开源不仅为视频创作者提供了强大的工具,也为AI技术的普及和应用带来了新的可能。无论是从技术角度还是用户体验角度,EchoMimic都展现了其卓越的性能和广阔的应用前景。如果你对这项技术感兴趣,不妨亲自试试,相信你会被其强大的功能所惊艳。

2024-07-14 16:06:17 725

原创 赛博活佛再出手,PaintsUndo一键生成绘画全过程视频!

在AI技术飞速发展的今天,创新的应用层出不穷。最近,ControlNet的作者又带来了一项令人瞩目的新项目——。它能够在短短几分钟内,将一张静态图像转化为一段完整的绘画过程视频。图片简而言之,PaintsUndo的核心功能是将用户上传的静态图像转换成一段视频,展示从线稿到成品的完整绘画过程。这个过程不仅神奇,而且最终生成的视频与原图像高度相似,仿佛是艺术家亲手绘制一般。

2024-07-14 15:10:11 377

原创 EmotiVoice-Plus:你的AI语音合成新神器,支持多人剧本对话!

前几天,网易有道又搞了个大新闻,他们在原有的EmotiVoice基础上推出了一个增强版本,叫。这玩意儿不仅继承了EmotiVoice的核心功能,还新增了多人剧本对话支持,直接让创作变得更加多样化。软件界面EmotiVoice本身就是一个很牛逼的文本转语音引擎。:无论你是要生成中文还是英文语音,它都能轻松搞定。:你可以选择适合的声音类型,增加语音的多样性和个性化。:这个功能简直是一大亮点,你可以创建具有多种情感的语音,比如快乐、兴奋、悲伤、愤怒等。:操作简单,适合各种用户。

2024-07-14 10:43:33 354

原创 Mac本地运行AI数字人软件Easy-Wav2Lip,更快,更强!

Wav2Lip技术可以让视频中的人物根据输入的音频生成匹配的唇形动作,从而实现口型与语音同步的效果。这项技术不仅适用于静态图像,还能够对动态视频进行处理,生成与目标语音同步的视频输出。Easy-Wav2Lip的出现,无疑为我们带来了更多可能性。无论是从处理速度还是视觉效果上,它都远远领先于Wav2Lip。希望大家能够充分利用这项技术,创造出更多精彩的作品。

2024-07-13 15:39:06 391

原创 多任务视觉轻量模型Florence2,微软出品!

图像反推、语义分割、文字识别、全能王Florence2模型整合包、微软刚刚推出了一个超级强大的视觉识别模型——Florence2。这个模型不仅能进行图片文本识别,还能进行对象检测和语义分割,简直是全能王。更厉害的是,Florence2执行效率特别高,识别速度超快,而且占用空间小。相比大型模型如Flamingo,Florence2在全画面分割和复杂语义识别上表现非常出色,仅需3秒就能完成任务。它还提供了微调版本,针对不同任务进行优化,并且内置多种模式,适应不同需求。

2024-07-06 14:20:36 333

原创 LivePortrait:静态肖像图生成动态视频Windows版本一键运行包

最近,快手开源了一个非常有趣的项目——LivePortrait。这款工具可以让你通过一张静态肖像图像生成动态视频,效果非常惊艳。图片要知道,可灵的文生视频和图生视频功能不仅备受关注,还一路火到了海外。这次开源的LivePortrait效果也十足惊艳!虽然驱动肖像生成视频的技术并不算新鲜,但还是靠效果征服了观众。LivePortrait能够精确控制眼睛的注视方向和嘴唇的开合动作。还可以处理多个人物肖像的无缝拼接,将不同的人物特征合并到一个视频中,确保在多个动态人物之间过渡平滑,不会产生突兀的边界效果。

2024-07-06 11:56:43 974

原创 MimicMotion一张图片就可以生成小姐姐跳舞的视频,Windows一键运行包

最近,腾讯和上交大合作推出了一款名为MimicMotion的AI工具,简直是视频生成领域的一次重大突破。你只需提供一张姿态序列图片,MimicMotion就能生成细节丰富、逼真的人类动作视频,无论是舞蹈、运动还是日常活动,统统不在话下。

2024-07-05 13:58:23 685

原创 带表情控制的AI换脸整合包:Face Adapter

前几天,AI领域又迎来了一项令人振奋的新技术——Face Adapter。这是一种专门为预训练的扩散模型设计的适配器,能够实现面部重演和面部交换,同时还提供了精细的个体识别和属性控制功能。通过这个模型,你可以一次性生成两张图像,既包含原图像的面部特征,又融入目标图像的表情特征,实现无缝的面部信息迁移和融合。Face Adapter的出现,无疑将为面部编辑领域带来革命性的变化。图片在面部编辑领域,尤其是面部重演和面部交换任务中,现有的技术表现并不尽如人意。

2024-06-30 16:51:59 285

原创 碉堡了!离线实时翻译、同声传译安卓APP分享!

RTranslator 是一款功能强大、注重隐私的实时翻译应用。无论是旅行、商务还是日常交流,它都能为用户提供极大的便利。如果你对这款应用感兴趣,不妨下载尝试,并为开源项目贡献自己的力量。

2024-06-29 10:46:44 442

原创 Mac版CodeFormer,超强AI人脸修复工具本地运行包

CodeFormer被誉为“业界顶尖AI去马赛克工具”,它能有效清除学习和研究道路上的障碍。这款工具运用了尖端的神经网络AI技术,能够精确地修复各种破损、模糊、不完整以及黑白的照片和视频,效果令人瞩目!是不是已经迫不及待想要试试这款神奇的工具了?赶紧下载体验吧,让你的旧照片和视频焕发新生!

2024-06-28 20:57:30 2443

原创 完全在浏览器本地运行的照片修复神器:inpaint-web!

是一个基于WebGPU和WASM技术的免费开源工具,它能够在浏览器端实现图像的修复(inpainting)和放大(image-upscaling)。这意味着不需要安装任何软件,只需打开浏览器,即可对图片进行高质量的处理。不仅仅是一个工具,它是开源社区智慧的结晶,是技术与创意的结合。无论你是专业摄影师还是图像处理爱好者,都能成为你提升作品质量的得力助手。

2024-06-28 15:19:23 431

原创 PCM完爆LCM,一步即可生成高清图像!

大家好,今天我们要聊聊一种新型图像生成技术——PCM。这个技术不仅高效,还能生成高质量的图像,完胜传统的LCM。它通过一致性函数实现了更高的稳定性,还能进行零样本图像编辑,比如超分辨率、修复和上色等。PCM在各类应用场景中表现都非常出色,不仅能生成高分辨率图像,还能用于视频生成。特别是文本生成图像,PCM可以根据文字描述生成清晰、符合要求的图像。而且在需要快速生成高质量图像的情况下,PCM的表现也非常抢眼。PCM图像生成。

2024-06-25 22:11:05 390

原创 MimicBrush 使用一张图片,对另一张图局部风格重绘

前几天,阿里巴巴、香港大学和蚂蚁集团的研究人员联合推出了一款超厉害的AI工具,名字叫MimicBrush。这款工具简直就是图像编辑界的“魔法棒”,它能让你轻松地在一张图片上指定需要编辑的区域,然后用另一张图片的风格来进行局部重绘。听起来是不是很酷?那我们一起来看看这个“魔法棒”到底有多神奇!

2024-06-24 17:44:39 387

原创 忘记 Stable Diffusion吧,⚡️闪电扩散Flash Diffusion来了!

Flash Diffusion技术的出现,不仅推动了图像生成技术的发展,也为创意产业带来了新的可能性。随着技术的不断进步和优化,我们有理由相信,Flash Diffusion将在未来的图像处理和创意表达中扮演更加重要的角色。

2024-06-22 19:58:40 895

原创 Mac视频翻译,一键实现语音识别、字幕翻译、自动配音

集成了强大的模型,并支持自定义模型。这意味着你可以根据自己的需求,选择最合适的翻译和配音模型。此外,它还提供了批量语音转字幕、批量字幕翻译、批量配音等小工具,极大地提高了工作效率。的出现,无疑为视频内容创作者和多语种视频处理带来了巨大的便利。无论是个人创作者还是企业,都能从中受益。如果你正苦于视频翻译和配音的繁琐,不妨试试,让它成为你创作路上的得力助手!

2024-06-21 10:06:30 734

原创 开源大模型能看到视频了?还能生成视频解说!

ShareGPT4Video系列的发布,不仅为学术界带来了新的研究工具,更为多模态AI的发展注入了新的动力。随着技术的不断进步,我们有理由相信,未来在视频理解与生成领域,人工智能将展现出更加惊人的能力。

2024-06-20 22:28:50 360

原创 效果炸裂!AI绘画版神笔马良,指哪画哪!

序号组件名称描述1语义调色板创建和管理文本提示-掩码对,也称为_语义画笔_。2创建新_语义画笔_按钮创建一个新的文本提示-掩码对。3主绘图板用户在每个语义层上使用画笔工具绘画。4图层选择每个图层对应于语义调色板中的每个提示掩码。5背景图像上传用户上传背景图像以开始绘画。6绘图工具使用画笔和橡皮擦交互式地编辑提示掩码。7播放按钮在流模式/逐步模式间切换。8显示生成的图像通过此组件流式传输。9掩码透明度控制在量化前更改当前语义画笔的掩码透明度值。

2024-06-20 12:19:13 664

原创 Mac专属大模型应用Chat-with-MLX,支持RAG,附千问2整合包!

大家好,今天要给大家介绍一个为Apple Silicon Mac量身打造的革命性产品——!这不仅是一个聊天工具,而是一个全功能的大型语言模型聊天界面。它利用了苹果自家的MLX框架,为用户带来了前所未有的隐私保护和聊天体验。Chat with MLX基于检索增强生成技术(RAG),能与多种开源模型互动,支持多种文件格式和通过URL添加的YouTube视频。这个应用不仅支持多语言交互,还能方便地集成任何HuggingFace和MLX兼容的开源模型,特别适合在MacOS和Apple Silicon上使用。

2024-06-19 08:51:40 903

原创 Mac版神器inpaint-web,让老照片焕然一新

是一个基于WebGPU和WASM技术的免费开源工具,它能够在浏览器端实现图像的修复(inpainting)和放大(image-upscaling)。这意味着不需要安装任何软件,只需打开浏览器,即可对图片进行高质量的处理。不仅仅是一个工具,它是开源社区智慧的结晶,是技术与创意的结合。无论你是专业摄影师还是图像处理爱好者,都能成为你提升作品质量的得力助手。

2024-06-18 17:12:01 374

原创 百度开源数字人项目Hallo,效果炸裂!

Hallo项目不仅推动了肖像动画技术的发展,也为个性化和多样化的动画创作提供了新的可能性。随着技术的不断进步,我们期待未来能够看到更多令人惊叹的动画作品。

2024-06-17 23:55:02 1693 1

原创 Mac版ChatTTS-UI:一键文字转语音的神器,支持API调用!

最近有一个非常有趣的项目,叫做ChatTTS-UI。它是一个简单的本地网页界面,可以使用ChatTTS将文字合成为语音,还支持对外提供API接口。软件界面。

2024-06-17 10:36:16 649

原创 GLM-4开源,多模态性能比肩GPT4V

用户可以通过在中注册新的工具来扩展模型的能力。使用装饰器即可轻松注册。工具声明中,函数名称代表工具名,docstring为工具说明,参数使用Annotated标注类型、描述和是否必须。def get_weather(city_name: Annotated[str, '城市名称', True]) -> str:"""获取`city_name`未来一周的天气情况"""...自定义工具注册示例。

2024-06-11 09:09:32 655

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除