自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(31)
  • 收藏
  • 关注

原创 图灵奖得主瓦利安特:人们应更全面地了解人工智能!

对于人工智能也是如此。他强调,政府、科学家与社会应共同努力,制定和完善相关法律法规,加强监管和执法力度,确保人工智能技术的健康发展。在未来的日子里,让我们携手努力,共同推动人工智能技术的进步与发展,为人类社会创造更加美好的未来。瓦利安特首先指出,人工智能将在不远的将来深入人类生活的方方面面,成为我们工作、学习和娱乐的重要助力。访谈中,瓦利安特博士以他深厚的学术背景和前瞻性的视角,就人工智能(AI)的未来发展及其对人类社会的影响,提出了深刻见解,并特别强调人们应更加全面地了解这一领域。

2024-07-20 11:30:00 86

原创 腾讯元宝上线“3D角色梦工厂”:快速生成专属3D角色!

这一过程中,腾讯混元大模型采用了3D换头技术、3D几何雕刻技术以及PBR(基于物理的渲染)材质贴图技术,显著提升了3D人物生成的效果。腾讯元宝3D生成应用的诞生,标志着3D建模技术的普及化时代已经到来。7月16日,腾讯旗下大模型应用“腾讯元宝”上线“3D角色梦工厂”,允许用户通过上传一张五官清晰的正面头像,并选择不同的角色模板,迅速生成个人3D角色!无论是游戏玩家、动画爱好者,还是设计师、艺术家,都可以通过元宝3D生成应用轻松创建出自己喜欢的3D角色,实现自己的创意和想象。

2024-07-18 17:08:19 220

原创 快手开源图生视频模型——LivePortrait:一键让肖像“活”起来!

此外,LivePortrait 利用紧凑的隐式关键点代表混合形状,并设计缝合和重定向模块,这些模块使用计算开销极小的小型MLP,从而增强了对生成动画的控制能力。项目的部署比较简单,首先克隆仓库,使用conda创建虚拟环境,安装所需的依赖项和FFmpeg。LivePortrait的亮点在于它不仅能够精确控制眼睛的注视方向和嘴唇的开合动作,还能处理多个人物肖像的无缝拼接。你可以将不同的人物特征合并到一个视频中,而且这些人物之间的过渡将平滑自然,不会产生任何突兀的边界效果。今天带大家一起了解一下~

2024-07-16 14:46:02 334

原创 免费开源工具—— Clarity Al:一键图像放大/增强,Magnific平替!

Clarity AI 可以作为 Magnific 的免费平替使用,它提供了 Replicate 在线免费体验和 SD WebUI 本地安装 2 种使用途径,此外 Clarity AI 也已经作为商业工具推出,不过需要付费才能使用。MagnificAl是一款基于人工智能技术的图像处理工具,主要功能包括图像放大、像素级AI重绘、灵活的设置调整以及多种优化场景。无论是风景、人物、插画、动漫还是室内照片,Clarity AI都能搞定,基本一键就能把图片放大得清清楚楚,细节一点不丢!

2024-07-12 16:11:16 878

原创 快手文生图AI工具——可图:会写汉字、最懂中文~

该模型基于数十亿图文对进行训练,支持256的上下文token数,支持中英双语,关键是支持在图片中生成中文字体,在人工和机器的双重评估中,综合得分略微超过Midjourney-v6的标准。一张可爱机器人的照片,微距,变焦,高质量,电影,机器人拿着一个木牌,上面写着“跟小元一起学AI” 的文字。进入首页,点击【AI创作】,输入创意描述提示词,设置不同风格,点击【立即生成】,即可看到你的创作啦~黑发红唇的美女,五官清晰,港风复古,80年代,怀旧风场景,最好的质量,超细节,8K画质。

2024-07-11 16:24:26 569

原创 腾讯智影新玩法——AI视频:一键转化为动漫!

智影AI视频风格化功能的使用非常简单,只需导入视频并一键变身,就能快速生成风格化视频(支持10s视频)。通过智影AI的强大技术,可以轻松将普通的视频变得更加美观、有趣。打开智影小程序,选择AI视频功能,点击“导入视频变身”按钮,选择自己想要变身的视频,稍等片刻即可获得一个动漫化视频。最近它的小程序版本又上线了一个有趣的新功能——智影AI视频功能,可以把你的视频一键生成风格化视频,一起来看看吧~现在智影AI视频功能提供日漫风格供创作者们选择,让你的视频一键动漫化,化身漫画主角,此功能目前限时免费!

2024-07-10 15:41:24 463

原创 阿里MotionShop——AI视频工具:一键替换视频人物为3D虚拟角色~

视频处理流水线负责提取并修复背景视频序列,而姿态估计与渲染流水线则生成虚拟形象的视频序列。MotionShop通过视频处理、角色检测、背景修复等多重步骤,能够将视频中的人物角色,一键转换成3D形象,同时保留其他场景和角色的原貌,为视频创作带来无限可能!近期AI相关的新奇应用层出不穷,今天小元老师要给大家安利一个由阿里巴巴研发的AI视频生成技术——MotionShop!上传一个包含人物的视频(请保证人物完整,视频时长不超过 15 秒);选择要替换的虚拟角色模型并点击生成,等待 10 分钟即可生成结果。

2024-07-09 11:39:42 593

原创 阿里达摩院——寻光:用AI,实现视频创作一条龙!

7 月 6 日,在2024 世界人工智能大会(WAIC 2024)上,阿里达摩院推出了一站式 AI 视频创作平台 —— 寻光,今天带大家提前来了解一下这款工具~

2024-07-08 15:00:15 979

原创 视频修复AI神器——ProPainter:一键去除动态水印甚至目标物!

接触视频后期制作的小伙伴们大概都有同感,最头疼的事情就是抠绿幕和去除视频里面的元素,尤其是长视频,绝对是一个劳神费力的大工程!今天给大家介绍一款超强的AI神器——ProPainter。

2024-07-06 11:00:00 338

原创 首个“可控”人物视频生成大模型--商汤Vimi:一张照片生成一分钟视频

与图片表情控制类技术只能控制头部表情动作不同,由 Vimi 生成的视频不但可以实现精准的人物表情控制,还可实现在半身区域内控制照片中人物的自然肢体变化,并自动生成与人物相符的头发、服饰及背景变化。而对于热衷表情包的用户来说,Vimi通过单张图片即可驱动生成各种趣味的人物表情包,玩法多样,实现创作自由。7月4日,商汤发布了业内首个面向C端用户的、“可控”人物视频生成大模型产品Vimi,毫不夸张的说,视频制作者的福音来了!支持生成分钟级的单镜头人物视频,在演示的视频中,可以看到视频长达1分钟;

2024-07-05 16:28:21 404

原创 AI语音工具——Fish Speech:使用简单,可训练专属语音模型!

Fish Speech是由 Fish Audio 开发的免费开源文本转语音模型。经过十五万小时的数据训练,Fish Speech能够熟练掌握中文、日语和英语,Fish Speech的语言处理能力接近人类水平,声音表现形式丰富多变。官网在线Demo上,上传了许多创作者训练的各种人物音色,比如理塘丁真、邓紫棋等明星音色,还有原生人物纳西妲、钟离、芙宁娜等,还有海量音色可直接使用。这个是其他开源TTS模型所不具备的,如果有现成的创作者训练好的音色模型,不需要我们自己再次去训练了(除非觉得效果不好)直接使用即可。

2024-07-04 14:46:25 2002

原创 最新文生3D模型——Meta 3D Gen:1 分钟搞定3D创作!

在虚拟现实和增强现实领域,3D Gen可以快速创建沉浸式环境和对象,可能会加速虚拟世界应用程序的开发,让我们一起期待它的正式上线吧!Meta 公司(前身为 Facebook)最近推出了一款名为 Meta 3D Gen(3DGen)的新型人工智能模型,能实现1分钟内的端到端生成,从文本直出高质量3D资产,不仅纹理清晰、形态逼真自然,而且生成速度比其他替代方案加快了3-60倍!如果有一个之前生成的,或者艺术家自己创作的无纹理3D网格,提供描述外观的文本提示后,模型也能在20s左右的时间中为它从头生成纹理。

2024-07-03 16:56:46 662

原创 视频一键动漫化AI工具——Diffutoon,拒绝鬼畜效果!

之前有一款视频一键动漫化AI工具—Domo AI ,可以实现文字、图片、视频的动漫化,最近又新出了一款类似的应用——Diffutoon,目前已开源,带大家一起来了解一下吧~Diffutoon是一款由阿里巴巴达摩院开源的视频转动漫AI工具,它不仅能处理静态图片,还能对整段视频进行卡通化转化,能够处理极高分辨率和快速运动的视频。利用先进的算法确保转换后的动漫视频质量,保留了原视频的细节,同时展现出动漫的特色。支持多种动漫风格,用户可以根据需要选择适合的风格,实现个性化的视频转换。

2024-07-02 14:09:37 637

原创 联想Autostudio——AI漫画工具:多轮对话可保风格一致!

AutoStudio 是一个创新的多轮交互式图像生成框架,由中山大学深圳校区和联想研究院的研究人员共同开发。漫画是我们在日常生活中常用的消遣方式之一,随着AI技术的发展,也催生出很多AI漫画工具,但是可惜的是,市面上绝大部分的AI只能创作出单帧的漫画,根本做不到拥有连贯的剧情和统一的人物····AutoStudio还引入了平行UNet和主题初始化生成法,提高了生成的图像在多轮交互中的一致性,因此。但今天,给大家介绍的这款AI绘画工具——Autostudio,它可以根据你的描述生成连续的漫画!

2024-07-01 16:16:02 342

原创 办公神器——商汤“办公小浣熊”正式上线微信小程序版!

近日,商汤科技宣布,基于其强大的“日日新SenseNova”大模型能力开发的数据分析产品“办公小浣熊”正式上线微信小程序版——Raccoon智能助手!小程序版以其独特的设计与强大功能,完美融合了网页版的全面性与移动办公的灵活性。

2024-06-28 17:18:18 352

原创 ​AI一键抠图神器——Ashampoo:效果惊艳,限时免费!

Ashampoo Background Remover 是一款强大的图片编辑软件,它能够自动检测并分离图片中的对象,包括最微小的细节如发丝。这款软件在官网的价格是150元,现在可以完全免费使用!在图像编辑领域,背景人物抠像是一项常见但耗时的任务,今天小元老师给大家介绍一款AI抠图神器-Ashampoo Background Remover,用过的人都说好!首次打开软件需要登录账号和密码,大家可以去官网里注册一个。软件使用十分简单,我们添加照片后,软件会自动扣图,然后再根据效果【移除】和【增加】调整即可。

2024-06-27 17:08:58 519

原创 字节跳动发布“豆包 MarsCode”智能开发工具,面向国内开发者免费!

豆包 MarsCode 还计划协同各开发者社区,将 AI 能力融入到社区使用场景中,将豆包 MarsCode 的能力更便捷地提供给开发者。编程助手提供智能补全、智能预测和智能问答等功能,而云端IDE则支持一键开箱即用,为开发者提供便捷的开发环境。当然,MarsCode IDE 也内置 AI 编程助手,“支持智能补全”、“智能预测”、“智能问答”等能力。随时随地编程,一键开箱即用,简化开发过程,提高效率 ,支持智能补全、智能预测、智能问答等能力。工具会根据你的输入,自动给出代码建议,帮助你快速完成代码。

2024-06-27 17:05:56 413

原创 阿里开源AI工具——MimicBrush:一键搞定局部替换!

在训练的时候,它会随机从一段视频里挑选两帧图片,一帧作为"源图",另一帧作为"参考图",然后尝试用参考图的信息来补全源图上被遮挡的部分。经过大量训练,它就学会了如何自动找到对应关系,实现图像的"模仿编辑"。MimicBrush包含两个主要部分"imitative U-Net"和"reference U-Net",它们之间会进行信息交互,帮助系统定位出参考图像中对应的区域。它的操作很简单,只需要在原图像上要编辑的区域绘制蒙版,然后给定一张参考图片,就可以把参考图片中的特征提取出来复制到我们的原始图片中。

2024-06-26 15:11:15 531

原创 大厂纷纷入局大模型志愿填报,夸克、百度、靠谱AI各显神通!

距离2024年高考已经过去两周时间,全国各地已经陆续进入高考“放榜”时间,乾坤已定,大家也都暂时舒了一口气。但俗话说“三分考七分报”,接下来考生们还要面临新一轮的考试——志愿填报。但今年显然这个难题的解决就容易多了,因为随着大模型、生成式AI技术持续突破,AI技术越来越多地被应用于高考志愿填报!输入高考地区、考试分数、区域位次、兴趣方向等信息,就能生成一张高考志愿信息表,建议的大学、专业和录取概率一应俱全,再也不用自己一个个查信息!AI系统哪家强?2024年升学季,靠谱AI、夸克、百

2024-06-25 15:13:36 951

原创 AI工具——Hedra:上传音频+照片,一键创作口型匹配视频~

Hedra 是一个专注于利用先进的AI技术将基础模型转化为创意产品的实验室,其核心产品Character-1支持根据任意人物照片和语音内容生成具有表现力和可控性的人类角色视频。用谷歌账号授权登录,点击Try beta按钮,即可进入体验,用户只需上传一张图片,再生成一段音频,就能让它开口说话或唱歌。通过Character-1工具,你可以将静态照片和音频文件转化为生动的动画视频,生成表现丰富的人类角色。目前开放预览版支持30秒的视频生成,如果H100供应充足,每60秒可生成90秒的内容。

2024-06-24 14:23:39 959

原创 AI神器—VidAU:产品链接一键生成视频,轻松实现换脸、翻译!

今天给大家介绍一个超酷的视频工具——VidAU,它可以在几分钟内批量生成引人入胜的视频。只需通过产品链接或描述,就能轻松创建视频,使用逼真的A虚拟代言人用多种语言和门音进行进解。提供视频换脸技术,使用户能够将视频中的面孔替换为其他面孔。自动将视频内容翻译成不同的语言,扩大视频的受众范围。允许用户输入视频或音频的URL,平台自动生成视频。创建虚拟形象并生成视频,适用于社交媒体、广告等。支持批量生成视频,提高内容生产的效率。自动翻译视频字幕或从视频中移除字幕。*西安觉醒元宇宙AI,是专注线上。

2024-06-22 11:00:00 371

原创 Claude 3.5 Sonnet震撼发布!性能全面超越GPT-4o!

它在标准视觉基准上超越了Claude 3 Opus,对于需要视觉推理的任务表现出了显著的优势,并新引入了一种可视化“Artifacts”的交互方式,当用户要求Claude生成代码片段、文本文档或网站设计等内容时,这些组件会出现在对话旁边的专用窗口中。所以,不少网友对Claude 3.5的优化能力相当吃惊,要知道Anthropic的旗舰模型Claude 3 Opus才刚刚发布了3个月,相比之下Claude 3.5的成本却降低了80%,运行效率提升了2倍。更通人性,更能理解细节和复杂指令,创作高质量内容;

2024-06-21 14:37:43 474

原创 AI视频创作工具--元创岛:一键生成小说推文、短剧引流广告!

元创岛是一款由出门问问推出的AI短视频创作平台,依托出门问问自研大模型"序列猴子",为创作者提供AI一键成片原创短视频,快速生成小说推文、短剧引流广告、书单及歌单等短视频变现内容。出门问问是一家以生成式AI和语音交互为核心的人工智能公司,此前还推出了序列猴子大模型、AI配音产品魔音工坊、AI数字人奇妙元和A数字员工奇妙问。可以看到,创作时我们需要提供小说文案、调整视频风格参数、选择发音人和语速,即可一键创作。这款工具可以用来制作最近抖音上最火的小说引流视频,感兴趣的小伙伴们可以去试试!最终生成视频可导出。

2024-06-20 14:25:08 501

原创 阿里新模型——Champ:实现3D人物图像转视频!

Champ 利用先进的人体网格恢复模型,从输入的人体视频中提取出对应的参数化三维人体网格模型 SMPL 序列(Skinned Multi-Person Linear Model),进一步从中渲染出对应的深度图,法线图,人体姿态与人体语义图,作为对应的运动控制条件去指导视频生成,将动作迁移到输入的参考人像上,能够显著地提升人体运动视频的质量,以及几何和外观一致性。Champ模型的应用前景广阔。跟别的工具比,Champ的动作控制更精准,假影少,外观匹配度高,稳定性强,还能处理各种不同体型的人像,简直不要太棒!

2024-06-20 14:20:05 361

原创 Stability AI 开源Stable Audio Open!可生成47秒的立体声音频!

根据Stability AI 介绍,Stable Audio Open使用了486,492个录音训练数据,其中 472,618 个来自Freesound,13874个来自免费音乐档案馆,并且所有音频文件均根据 CC0、CC BY或CC Sampling+获得了商业许可。与 Stability AI 的商业 Stable Audio 产品不同,Stable Audio 可生成长达 3 分钟的更长、连贯的音乐曲目,而 Stable Audio Open 专注于使用文本提示生成长达 47 秒的高质量音频数据。

2024-06-20 14:16:45 410

原创 腾讯混元团队新模型——Follow-Your-Pose-v2:开启AI视频新纪元!

腾讯混元团队联合中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”,相关成果已经发表在 arxiv 上,今天就带大家一起来看看它有何不同~此外,这一技术还可以应用于虚拟现实中,为用户提供更加丰富和真实的交互体验。Follow-Your-Pose-v2是全新的图生视频模型,只需要输入一张人物图片和一段动作视频,就可以让图片上的人跟随视频上的动作动起来,生成视频长度可达10秒。例如,在电影制作中,可以通过这一模型快速生成角色的动态效果,大大减少制作成本和时间。

2024-06-19 18:35:37 308

原创 AI视频王者归来!Runway重磅发布——Gen-3 Alpha!效果太逼真了!

近期AI视频大模型简直是神仙打架!前有国产可灵,后有Luma,现在Runway又发布了与Gen-2相比,Gen-3在生成视频的质量、色彩、饱和度、光影、文本语义还原、运镜、动作一致性、场景切换等实现大幅度提升。此前Runway的联合创始人曾在今年2月25日说过,要做出比Sora更好的文生视频,果然兑现了诺言。今天带大家来一睹为快!Gen-3 Alpha能够生成接近真实世界质量的视频内容,具有高度的细节和清晰度。通过训练,模型能够精确控制视频中对象的动作和过渡,实现复杂场景的流畅动画。

2024-06-18 14:33:17 397

原创 更懂包装设计的AI工具——AI小方:一键生成设计方案!

为了全面准确的训练结果,实验室团队经过“图片筛选 — 图片预处理 — 标签处理 — 大模型微调” 几大步骤的处理对以农产品为代表的商品品类进行了海量数据集的训练,为AI小方产品的大模型夯实了基础。首先选择包装模型,设置好尺寸,点击图片选择刚才设计的牛排包装图,即可自动生成外包装礼盒样式,可以查看展开图和3D效果图,确认无误可直接下载印刷PDF文件。AI小方包装设计是北京大学信息技术高等研究院人工智能包装设计联合实验室团队发布的,专注于包装设计领域的AI工具。Al小方还可以生成其他平面物料,扩展其设计能力。

2024-06-17 14:21:47 581

原创 美图也能做视频?AI短片创作工具——MOKI来了!

在近日举办的第三届美图影像节上,美图公司发布了6款新品,其中包括AI短片创作工具——MOKI,先该工具采用了升级后的美图奇想大模型(MiracleVision)V5,它基于DiT技术架构,涵盖了图像、视频、音频和文本的大模型,实现了多方面的性能提升。目前MOKI官网已上线:https://www.moki.cn/,但产品功能还未开通,将于7月31号上线。与常规文生视频产品不同,MOKI可实现内容和成本的双重可控,目前可以进行多种视频场景的AI短片创作。Moki自动添加环境或特定动作音效,增强真实感。

2024-06-14 15:55:08 434

原创 字节AI工具——「海绵音乐」横空出世:更适合中国体质的音乐人创作!

之前火速出圈的国外AI音乐产品,很多小伙伴们是不是玩得不太过瘾,毕竟外国人做的产品对中文歌适配度都不太高,如今字节也终于推出了对标Suno的中文版AI音乐工具——海绵音乐(Haimian Music),今天带大家一起来了解一下!海绵音乐目前最多提供200词的创作(生成时最多为1分钟的时长),Verse和chorus部分也是一键直出,除此之外,海绵音乐还允许用户选择女声or男声,以及曲风和心情。在海绵音乐的创作里,用户可以通过灵感创作和自定义创作来定制音乐。点击下方链接即可进入试听~

2024-06-14 15:21:08 1390

原创 将开源贯彻到底,通义千问Qwen2发布即爆火!

Qwen2是阿里云通义千问团队开源的新一代大语言模型,推出了5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B.A14B和Qwen2-72B。Qwen2在多个评测基准上表现突出,特别是 Qwen2-72B-Instruct,支持128K tokens的上下文长度,就像读一本《战争与和平》那么长的小说,Qwen2也能毫不费力地理解和处理。Qwen2系列全家齐上阵,首次在所有尺寸的模型中使用GQA技术,让AI的推理速度更快,显存占用更低。

2024-06-14 15:14:34 554

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除