- 博客(59)
- 收藏
- 关注
原创 2025年最好用的15个免费AI工具,前几款直接封神!
今天给大家整理了一份2025年15款颠覆级AI工具单,覆盖写作、绘图、视频、办公、搜索等等领域,亲测免费版吊打付费软件!
2025-05-21 13:50:53
533
原创 AI配音 | 免费!这5个文字转语音工具太狠了,一键生成短视频爆款配音
本文介绍了五款免费的AI配音工具,帮助用户将文字转换为自然流畅的语音。这些工具包括ChatTTS、TextToSpeech、通义听悟、TTSMAKER和文字转语音助手。每款工具都提供了详细的使用教程,可以根据需求选择适合的工具进行文本转语音操作,生成的音频文件可下载并用于不同用途。这些工具不仅功能强大,而且操作简便,是制作高质量语音内容的理想选择。
2025-05-19 11:30:27
1107
原创 2025国产AI绘图工具杀疯了!!手残党也能秒出爆款图(全程免费)
官网:https://miaohua.sensetime.com/官网:http://116.62.221.222:8082/home。官网:https://jimeng.jianying.com/优势:语义理解精准,支持文生图/视频/动态特效,2K高清输出。官网:https://kling.kuaishou.com/官网:https://xinyu.jurilu.com/官网:http://www.qiyuai.net/官网:https://www.doubao.com。
2025-05-14 17:00:00
609
原创 2025年AI绘画工具红榜:从新手到大神的终极选型指南,免费又好用!
内置模板库、比例调节、参考图上传等功能,支持对已生成图像的指定部分进行局部修改,在广告设计、插画修改等场景中都很实用。提供适配竖屏比例、高动态范围(HDR)的AI生成内容,尤其擅长生成符合短视频传播特性的“抓眼球”画面(如夸张表情、高饱和度配色),工具定位偏娱乐化。功能亮点:即梦AI支持图片/视频/动态内容生成,擅长动漫头像和商业插画创作。功能亮点:慧言AI通过艺术与技术的深度融合,在创作自由度、产业适配度、技术可控性三个维度形成独特竞争力,正推动AI绘画从"玩具级工具"向"生产力工具"的实质性跨越。
2025-05-09 11:19:43
664
原创 救命!我已经彻底被最近的FLUX模型征服了
关键词:亚洲肖像,一个年轻女子在一片黄花的田野里,她穿着一件黄色的蕾丝连衣裙,她的头发暗而松散,灯光柔和而漫射,营造出梦幻般的气氛,她向一边看,这张照片是在黄金时间的自然光下拍摄的,模糊的背景中有高大的树木,视角在中等高度,捕捉了她的上半身和她周围的一些花朵。她背对着相机,背景是浅色的。关键词:女孩,月亮,兔子,抱着动物,现实,满月,独奏,汉服,中国衣服,动物,抱着,晚上,看着观众,长发,头发装饰,天空,户外,黑发。关键词:经典的美丽,亚洲女孩,一个女人在紫色的裙子上荡秋千,在粉红色的花田。
2024-09-06 17:52:50
853
原创 阿里重磅开源超强AI模型Qwen2-VL:能理解超 20 分钟视频!
这款新模型有三个不同参数的版本,分别是 Qwen2-VL-72B(720亿参数)、Qwen2-VL-7B 和 Qwen2-VL-2B。阿里巴巴的云计算部门刚刚发布了一款全新的 AI 模型 ——Qwen2-VL,而且一口气发布了20亿参数和70亿参数两个版本,还开放了最强720亿参数版本的API!除了英语和中文,Qwen2-VL 现在还支持识别图像中的多种语言文本,包括大部分欧洲语言、日语、韩语、阿拉伯语、越南语等等,真正做到了面向全球用户!用户还可以基于视频继续提问,两位宇航员穿的衣服是什么颜色的?
2024-08-30 14:55:53
970
原创 ComfyUI基础操作教学!小白入门必看!
就像我们第一节拆解基本工作流那样,一张图片的生成是依次进行的,首先大模型节点运行选择合适的大模型,接着是到了提示词节点识别提示词,然后在K采样器生成,最后VAE编码输出,因此我们要放入的节点一定要在它发挥作用的位置。因此我们可以根据这个找上一个接点,发现正向提示词上也有条件,所以可以得出controlnet节点是接在正向提示词之后的。将节点逻辑从大模型到正向提示词到采样器,增加为从大模型到lora模型到正向提示词到采样器。例如我们要放入的lora模型节点,它肯定是在选择大模型之后的。
2024-08-29 15:33:53
1732
原创 麦当劳用AI整活了!AI广告时代要来临了吗?
她日常更新的内容往往是以一个富有感染力的年轻女性形象。尽管广告试图营造出一种温馨愉悦的氛围,许多观众却对此产生了“恐怖谷”效应,AI生成的美少女形象虽然外表接近真实,但仍然存在微妙的不协调感,这让观众感到不自然,甚至引发不适感。一则日本麦当劳即将举行的薯条优惠活动的广告,15 秒的视频中出现了11 位美女,吸引了超千万的浏览,连马斯克看了都说——「Cool」。未来,随着技术的不断进步和应用的深入拓展,AI将在广告创意、投放策略、客户体验等多个环节发挥越来越重要的作用,AI的未来,势不可挡!
2024-08-28 16:44:08
703
原创 打破传统赚钱思维!普通人如何用AI变现?
在小红书、抖音等热门内容平台上,借助AI技术的力量,创作者能够批量创作出高质量的图片、文字及视频内容,这一转变极大地降低了创作的技术门槛,同时显著加速了内容的产出速度。尤为值得一提的是,小红书等平台对新手创作者采取的积极流量扶持策略,与AI工具的结合使用,使得即便是从零起步的创作者也能迅速积累起可观的粉丝基础,进而通过商业合作与订单承接实现变现!此外,随着各大AI绘画平台的崛起,训练并发布自己的大模型到模型网站,类似于哩布哩布,不仅能获得平台的奖励,还能吸引定制商单,实现技术变现的良性循环!
2024-08-26 15:38:54
933
原创 首款国产“3A”游戏《黑神话:悟空》爆火,背后有哪些AI技术在助力?
DLSS 3.5 中的帧生成技术是一个重要创新,它利用 40 系列显卡中的光流加速器,分析连续帧之间的运动数据,并在不影响图像质量的情况下生成更多的帧数。英伟达的 DLSS 3.5 版本进一步增强了这一技术,在《黑神话·悟空》中,DLSS 不仅提升了分辨率,还优化了游戏帧率表现。AI技术已经成为现代游戏中不可或缺的一部分。AI不仅在游戏行业取得了成功,AI技术也逐渐渗透到各行各业,无处不在的人工智能是我们即将进入的一个新时代,只有接受AI,拥抱AI,选择AI,我们才能在这个时代更好实现自我价值~
2024-08-23 15:43:56
1709
原创 用AI也能做短剧了?全球首款 AI 短剧平台 SkyReels重磅发布!
WorldEngine 结合了引擎的精确可控能力(如光照模拟、物理模拟、3D 空间、实时交互等) 以及 AI 视频大模型的幻想生成能力,提供了全新的线上混合视频创作模式,让视频创作从模糊生成迈向更加精确可控。几分钟到十几分钟的单集时长、强烈的娱乐性和快节奏剧情,频繁踩中用户「爽点」,仅在2023年,短剧市场规模就达到373.9亿元,预计2024年将超过500亿元,2027年则将超过1000亿元。接受了真实世界中高质量、专业分镜实例训练,专为分镜设计而生,也与通用类图像生成模型拉开了距离。
2024-08-20 14:30:31
1677
原创 华为开源UltraPixel超高像素模型:直出 6K 分辨率图片!
我们可以看到中间的节点上还有一个 controlnet_image 节点,没错,ultrapixel 也是支持 ControlNet 的,只不过支持的比较简陋,就支持一种。工作流也很简单,一个模型加载节点,中间的节点其实参数我们应该也都是熟悉的,我们主要关注提示词和宽高就可以了,最后一个节点就是输出图片了。如何让生成超高分辨率的图片,一直是文生图领域内研究的热点,目前只有Midjourney能支持生成高清大图,但人家是收费且闭源的。虽然生成图片的效果很不错,不过出图真的是有点慢。有压缩,实际细节很丰富。
2024-08-16 15:37:05
870
原创 Stable Diffusion 必学技能——从零开始训练专属 Lora 模型!
Lora模型全称是:Low-Rank Adaptation of Large Language Models,可以理解为Stable-Diffusion中的一个插件,在生成图片时,Lora模型会与大模型结合使用,从而实现对输出图片结果的调整。修改分辨率(之前数据集的尺寸是多少,这里就用多少)保存设置:保存模型的名称修改成你想要的名称,点击开始训练,就可以在终端看到它正在疯狂训练中...这个时间会比较久,慢慢等待就好。底模文件路径,选择你要训练Lora使用的大模型,直接点击右侧的小文件夹选择即可。
2024-08-14 15:09:54
854
原创 一次了解所有功能!超详细【Stable Diffusion界面】大揭秘!
出图的基础,也叫底模、大模型,默认启动后是没有大模型的,有一些启动包可能里会送一两个,但是大部分还是需要自己去下载的。全称是语言与图片对比预训练,它是用来控制我们的关键词(prompt)和生成图片的关联性,这么理解:数值越高,关联越弱,SD发挥的越多,偏离我们想要的效果数值越低,关联越强,SD发挥的越少,接近我们想要的效果。适用于真人场景,主要是用来修复扭曲的人脸,例如当人物的脸在整个画布中占比很小时(全身画),不可避免的会模糊,面部修复可以将脸部局部放大进行修复,这样就可以使脸部精细化。
2024-08-13 17:43:13
483
2
原创 100%打赢人类新手!乒乓界迎来智能新伙伴!
据官方数据显示,在与29名不同技能水平的人类选手的比赛中,它赢得了13场,胜率达到了45%。AlphaPong的亮相不仅让我们看到了人工智能在乒乓球领域的巨大潜力,更为未来智能体育的发展开辟了新的道路。同时,他们还利用高速摄像机和动作捕捉系统来跟踪球的位置和人类对手的球拍动作,确保机器人在比赛中能够做出准确的判断和反应。这种连续的反馈循环使得机器人的技能不断提升,逐渐弥合了模拟与真实场景之间的差距。想象一下,在紧张刺激的乒乓球赛场上,一位没有汗水、不知疲倦的机器人选手,正与人类运动员进行着激烈的对决。
2024-08-12 17:16:20
604
原创 一次了解所有功能!超详细【Stable Diffusion界面】大揭秘!
出图的基础,也叫底模、大模型,默认启动后是没有大模型的,有一些启动包可能里会送一两个,但是大部分还是需要自己去下载的。全称是语言与图片对比预训练,它是用来控制我们的关键词(prompt)和生成图片的关联性,这么理解:数值越高,关联越弱,SD发挥的越多,偏离我们想要的效果数值越低,关联越强,SD发挥的越少,接近我们想要的效果。适用于真人场景,主要是用来修复扭曲的人脸,例如当人物的脸在整个画布中占比很小时(全身画),不可避免的会模糊,面部修复可以将脸部局部放大进行修复,这样就可以使脸部精细化。
2024-08-12 17:10:40
686
原创 毒舌AI火爆上线,犀利点评笑翻全场,众人直呼:这谁顶得住啊!
在这个充满惊喜与意外的数字时代,一位新晋网红悄然诞生——不是某位颜值爆表的KOL,也不是才华横溢的UP主,而是一位拥有“毒舌”属性的AI!这位AI界的“吐槽大师”一上线,就以其犀利无比的点评风格,让无数网友直呼:“这AI,简直比亲妈还懂怎么戳心窝子!”这个AI不一样,小嘴仿佛“淬了毒”想象一下,科技界的超级巨星埃隆·马斯克,正沉浸在又一项创新成果的喜悦中,突然,这位毒舌AI横空出世:“马斯克先生,您的脑洞比黑洞还大,但请记得,不是每个想法都能成为现实,比如那个‘火星殖民计划’,别到时
2024-08-09 16:42:12
975
原创 用AI做宠物穿搭账号火了!3个月涨粉超5万!
你的角色是"专业的小红书运营”背景:目前你正在运营一个像人类一样的猫咪分享穿搭的账号,账号内容是猫咪模特分享穿搭注意;这些猫咪需要使用双脚站着走路,而且做着类似人类的行为,比如健身、烹饪、钓鱼等日常生活行为需要制作的内容有3部分:图片、标题、文秦需要你提供圈片描达、标题和文案,用表格的形式给我。这是真实拍摄所不能达到的效果。其实主要原因在小红书的用户女性居多,养宠物的女性也是一大把,宠物呆萌可爱的形象,大多数女生都无法抗拒。素材有了,配上文案、带上话题,上传至平台,一篇完美的笔记就这样水灵灵的生成啦!
2024-08-09 16:38:58
773
原创 AI赋能医疗:应用场景丰富,智慧医疗进入大趋势!
此外,医联推出的MedGPT大模型,基于Transformer架构,其参数规模达到100B(千亿级),预训练阶段使用了超过20亿的医学文本数据,致力于实现疾病预防、诊断、治疗到康复的全流程智能化诊疗。通过不断的创新和努力,AI大模型有望为医疗行业带来革命性的变化,提高医疗服务的质量和效率,为全球患者带来更大的福祉。而伴随着近年来人工智能的迅速发展,AI大模型以其卓越的数据处理能力和深度学习能力,正在成为医疗健康领域变革的关键力量,将大模型应用到具体的医疗场景,已成为医疗行业智慧化升级的重要课题。
2024-08-08 17:22:20
1506
原创 全球首例,AI “牙医”上岗:15 分钟搞定牙冠准备!
想象一下,你坐在牙科椅上,紧张得手心冒汗,然后突然走进来一个看起来像科幻电影里的机器人,对你说:“别担心,我来给你治牙!比起传统的X射线,OCT技术不仅没辐射,还能以90%的准确率自动检测龋齿,深入到牙龈线下方,甚至进入骨骼,提供前所未有的细节和精度。不过,这次可不是普通的牙医拿着小锤子和小钳子,而是一个超级智能的AI机器人,它正以惊人的8倍速进行诊疗,而且比人类医生还要精准!想象一下,未来的牙科诊所里,机器人牙医们忙碌地工作着,而我们只需要舒舒服服地坐在那里,享受着高科技带来的便捷和舒适。
2024-08-05 15:38:42
726
原创 【实操教程】手把手教你如何用Stable Diffusion,做服装款式设计!
那么如果我们喜欢一个款式但是想要看一下不同的配色效果呢,这个时候我们就可以用Various-wildcards通配符合集,选择这个色块通配符,然后附着在我们设定好的衣服后面,接着我们打开controlnet上传我们的参考图,选择canny模式,然后点击生成就能源源不断生成不同颜色配色的服装设计了。我这里写的是优雅的鸡尾酒会礼服,蕾丝细节。我们可以复制上面这一串带着两个下划线的词组,然后把它放到提示词里,这样在生成的过程中他就会在下方一系列提示词中抽一个进去发挥作用,每生成一次都会有一个不同的衣服出现。
2024-07-31 14:12:03
1876
原创 StableVideo 4D:开源神器,一键创建8角度动态3D视频!
SV4D使用方法也非常简单,用户只需要上传视频然后选择3D 相机姿势,经过大约40秒左右的推理就能完成视频创建。相比SV3D、STAG4D等同类模型,SV4D的推理效率和生成质量都获得了大幅度提升。它的效率也很惊人,40秒内就能生成8个视角的5帧视频,假如用户希望进行更深层次的4D优化,整个过程也不过20到25分钟。SV4D能把一个普通的视频,变成多个新视角的视频。你可以根据自己的创意需求,自由调整相机角度。不仅仅是多视角,SV4D还能生成动态的4D模型,这在视频制作领域可是个大突破!
2024-07-29 14:17:42
592
原创 OpenAI 重磅推出AI搜索引擎——SearchGPT:速度超快还没广告
这种快速、直接的搜索方式,无疑将极大地提升用户的搜索效率,减少在传统搜索引擎中反复查找、筛选信息的繁琐过程。在SearchGPT的搜索结果中,将突出引用和链接出版商的内容,确保用户能够知道信息的来源,并能在带有源链接的侧边栏中快速找到更多相关结果。北京时间7月26日凌晨,OpenAI正式发布了其备受期待的AI搜索功能原型——SearchGPT,标志着这家全球领先的人工智能公司正式进军搜索市场,与谷歌、Bing以及Perplexity等巨头展开直接竞争。
2024-07-29 14:15:16
397
原创 超火爆AI工具——Vozo:一键重写视频脚本、重新配音!
它的全名是Vozo Rewrite & Redub,Rewrite意味着重新编写,Redub代表重新配音,它能够根据提示词,重新生成视频脚本并能够通过克隆原说话人声音,为视频生成新的配音,外加同步口型!你可以从本地上传想要重写或重新配音的视频,或者直接复制粘贴TikTok、YouTube、Google Drive、Zoom的视频链接,也可以用官方提供的示例视频快速试试。此外,还有30分钟的重剪视频时长,3分钟的视频翻译时长,以及1.5分钟的口型同步时长。这确保了视频中的对话看起来真实自然,提升了观看体验。
2024-07-26 16:26:57
1652
原创 谷歌AI拿下IMO奥数银牌!6道题轻松解出4道~
在IMO 2024中,AlphaGeometry 2更是以惊人的速度,在19秒内解决了第四道几何题,展示了其卓越的性能。AlphaProof的独特之处在于其自训练机制,通过不断生成和验证候选解决方案,逐步强化自身的语言模型,提高解决更具挑战性问题的能力。它不仅展示了人工智能在数学推理领域的强大实力,也为未来科学技术的发展注入了新的活力和动力。谷歌的混合AI系统——AlphaProof和AlphaGeometry 2共同应对了这一挑战,成功解答了四道题目,并获得满分,总分为28分,达到了银牌水平。
2024-07-26 16:09:15
407
原创 视频生成AI工具——PixVerse V2 登场:支持一键生成5段、最长 40S 连续视频!
就在昨天,光源伙伴 「 爱诗科技 」正式发布其视频生成产品 PixVerse V2 , 并全球同步开放,更低门槛,更高质量,更有逻辑,更长时长,这几个“更”,让这款产品受到了超高关注,今天带大家来了解一下~PixVerse V2采用 Diffusion+Transformer(DiT)基础架构,实现多项技术创新。,PixVerse V2 引入了自研的时空注意力机制,不仅超越了传统的时空分离和 fullseq 架构,而且显著提升了对空间和时间的感知能力,使得在处理复杂场景时表现更为出色。
2024-07-25 16:57:13
1336
原创 文生视频AI工具——白日梦AI:最高支持生成6分钟视频!
体验下来,这款工具人物/场景一致性还是非常好的,不会出现主角的突然“换脸”,有一套完整的AI视频创作工作流,可以帮助我们提升创作效率。生成的图片可进行详细的编辑,通过重新修改出镜角色、分镜、画面提示词,让图片更符合你的故事情节,编辑好后选择生成视频即可!在“选择分镜”环节,系统会提供分镜脚本,你只需要根据剧情选择合适的中景、近景等,选择好后即可点击生成图片。想要生成一个完整的视频,步骤分为5项:编写故事——角色设定——选择分镜——编辑图片——生成视频。能够根据用户输入的故事描述生成情节连贯的漫画和短视频。
2024-07-24 18:44:52
4519
1
原创 阿里巴巴最新开源AI工具——EchoMimic:让照片说话唱歌动起来!
之前给大家介绍过好几款能让照片“活起来”的AI工具:EMO、LivePortrait,今天再和大家聊聊蚂蚁集团最近推出的EchoMimic,一起来感受一下有何不同~在此之前的同类工具都只能用音频或者只用面部关键点的方法,会出现不稳定、不自然的状况,而EchoMimic的组合拳相当于给数字人开了挂!EchoMimic通过音频信号和面部关键点生成高质量和富有表现力的“说话头”视频,展示了在肖像动画领域的显著进步。它会融合音频和面部特征,生成的面部动画看起来很符合真实的面部运动和表情变化。
2024-07-23 15:23:20
3280
2
原创 全新AI工具——PaintsUndo:一键自动还原图像绘画过程!
项目的核心在于一系列基于AI的模型,这些模型能够接受图像输入并输出绘画序列,展示从初步素描到最终作品的详细步骤。这些步骤包括但不限于草图绘制、描线、上色、阴影处理、形状转换、左右翻转、颜色曲线调整、图层可见性变化,甚至在绘画过程中的创意调整。这种模拟人类绘画行为的能力,不仅为艺术家提供了新的表达方式,也为AI技术在艺术创作领域的应用开辟了新的路径。PaintsUndo 是一项突破性的技术,旨在通过输入静态图像,自动生成该图像的整个绘画过程视频,可以处理各种类型的图像。
2024-07-22 13:51:33
1439
原创 图灵奖得主瓦利安特:人们应更全面地了解人工智能!
对于人工智能也是如此。他强调,政府、科学家与社会应共同努力,制定和完善相关法律法规,加强监管和执法力度,确保人工智能技术的健康发展。在未来的日子里,让我们携手努力,共同推动人工智能技术的进步与发展,为人类社会创造更加美好的未来。瓦利安特首先指出,人工智能将在不远的将来深入人类生活的方方面面,成为我们工作、学习和娱乐的重要助力。访谈中,瓦利安特博士以他深厚的学术背景和前瞻性的视角,就人工智能(AI)的未来发展及其对人类社会的影响,提出了深刻见解,并特别强调人们应更加全面地了解这一领域。
2024-07-20 11:30:00
355
原创 快手开源图生视频模型——LivePortrait:一键让肖像“活”起来!
此外,LivePortrait 利用紧凑的隐式关键点代表混合形状,并设计缝合和重定向模块,这些模块使用计算开销极小的小型MLP,从而增强了对生成动画的控制能力。项目的部署比较简单,首先克隆仓库,使用conda创建虚拟环境,安装所需的依赖项和FFmpeg。LivePortrait的亮点在于它不仅能够精确控制眼睛的注视方向和嘴唇的开合动作,还能处理多个人物肖像的无缝拼接。你可以将不同的人物特征合并到一个视频中,而且这些人物之间的过渡将平滑自然,不会产生任何突兀的边界效果。今天带大家一起了解一下~
2024-07-16 14:46:02
960
原创 免费开源工具—— Clarity Al:一键图像放大/增强,Magnific平替!
Clarity AI 可以作为 Magnific 的免费平替使用,它提供了 Replicate 在线免费体验和 SD WebUI 本地安装 2 种使用途径,此外 Clarity AI 也已经作为商业工具推出,不过需要付费才能使用。MagnificAl是一款基于人工智能技术的图像处理工具,主要功能包括图像放大、像素级AI重绘、灵活的设置调整以及多种优化场景。无论是风景、人物、插画、动漫还是室内照片,Clarity AI都能搞定,基本一键就能把图片放大得清清楚楚,细节一点不丢!
2024-07-12 16:11:16
1962
原创 快手文生图AI工具——可图:会写汉字、最懂中文~
该模型基于数十亿图文对进行训练,支持256的上下文token数,支持中英双语,关键是支持在图片中生成中文字体,在人工和机器的双重评估中,综合得分略微超过Midjourney-v6的标准。一张可爱机器人的照片,微距,变焦,高质量,电影,机器人拿着一个木牌,上面写着“跟小元一起学AI” 的文字。进入首页,点击【AI创作】,输入创意描述提示词,设置不同风格,点击【立即生成】,即可看到你的创作啦~黑发红唇的美女,五官清晰,港风复古,80年代,怀旧风场景,最好的质量,超细节,8K画质。
2024-07-11 16:24:26
1399
原创 腾讯智影新玩法——AI视频:一键转化为动漫!
智影AI视频风格化功能的使用非常简单,只需导入视频并一键变身,就能快速生成风格化视频(支持10s视频)。通过智影AI的强大技术,可以轻松将普通的视频变得更加美观、有趣。打开智影小程序,选择AI视频功能,点击“导入视频变身”按钮,选择自己想要变身的视频,稍等片刻即可获得一个动漫化视频。最近它的小程序版本又上线了一个有趣的新功能——智影AI视频功能,可以把你的视频一键生成风格化视频,一起来看看吧~现在智影AI视频功能提供日漫风格供创作者们选择,让你的视频一键动漫化,化身漫画主角,此功能目前限时免费!
2024-07-10 15:41:24
1405
原创 阿里MotionShop——AI视频工具:一键替换视频人物为3D虚拟角色~
视频处理流水线负责提取并修复背景视频序列,而姿态估计与渲染流水线则生成虚拟形象的视频序列。MotionShop通过视频处理、角色检测、背景修复等多重步骤,能够将视频中的人物角色,一键转换成3D形象,同时保留其他场景和角色的原貌,为视频创作带来无限可能!近期AI相关的新奇应用层出不穷,今天小元老师要给大家安利一个由阿里巴巴研发的AI视频生成技术——MotionShop!上传一个包含人物的视频(请保证人物完整,视频时长不超过 15 秒);选择要替换的虚拟角色模型并点击生成,等待 10 分钟即可生成结果。
2024-07-09 11:39:42
5041
原创 阿里达摩院——寻光:用AI,实现视频创作一条龙!
7 月 6 日,在2024 世界人工智能大会(WAIC 2024)上,阿里达摩院推出了一站式 AI 视频创作平台 —— 寻光,今天带大家提前来了解一下这款工具~
2024-07-08 15:00:15
1684
原创 视频修复AI神器——ProPainter:一键去除动态水印甚至目标物!
接触视频后期制作的小伙伴们大概都有同感,最头疼的事情就是抠绿幕和去除视频里面的元素,尤其是长视频,绝对是一个劳神费力的大工程!今天给大家介绍一款超强的AI神器——ProPainter。
2024-07-06 11:00:00
1683
原创 首个“可控”人物视频生成大模型--商汤Vimi:一张照片生成一分钟视频
与图片表情控制类技术只能控制头部表情动作不同,由 Vimi 生成的视频不但可以实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。而对于热衷表情包的用户来说,Vimi通过单张图片即可驱动生成各种趣味的人物表情包,玩法多样,实现创作自由。7月4日,商汤发布了业内首个面向C端用户的、“可控”人物视频生成大模型产品Vimi,毫不夸张的说,视频制作者的福音来了!支持生成分钟级的单镜头人物视频,在演示的视频中,可以看到视频长达1分钟;
2024-07-05 16:28:21
604
原创 AI语音工具——Fish Speech:使用简单,可训练专属语音模型!
Fish Speech是由 Fish Audio 开发的免费开源文本转语音模型。经过十五万小时的数据训练,Fish Speech能够熟练掌握中文、日语和英语,Fish Speech的语言处理能力接近人类水平,声音表现形式丰富多变。官网在线Demo上,上传了许多创作者训练的各种人物音色,比如理塘丁真、邓紫棋等明星音色,还有原生人物纳西妲、钟离、芙宁娜等,还有海量音色可直接使用。这个是其他开源TTS模型所不具备的,如果有现成的创作者训练好的音色模型,不需要我们自己再次去训练了(除非觉得效果不好)直接使用即可。
2024-07-04 14:46:25
10018
原创 最新文生3D模型——Meta 3D Gen:1 分钟搞定3D创作!
在虚拟现实和增强现实领域,3D Gen可以快速创建沉浸式环境和对象,可能会加速虚拟世界应用程序的开发,让我们一起期待它的正式上线吧!Meta 公司(前身为 Facebook)最近推出了一款名为 Meta 3D Gen(3DGen)的新型人工智能模型,能实现1分钟内的端到端生成,从文本直出高质量3D资产,不仅纹理清晰、形态逼真自然,而且生成速度比其他替代方案加快了3-60倍!如果有一个之前生成的,或者艺术家自己创作的无纹理3D网格,提供描述外观的文本提示后,模型也能在20s左右的时间中为它从头生成纹理。
2024-07-03 16:56:46
1170
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人