来源:量子位
“手机修图神器”美图,也来大模型领域一展身手了!
美图发布了奇想智能(MiracleVision),一个“懂美”的AI视觉大模型。
除此之外,还一口气官宣了另外6款涵盖视频、设计和数字人等领域的AI产品——
AI视觉创作工具WHEE,AI口播视频工具开拍,桌面端AI视频编辑工具WinkStudio,主打AI商业设计的美图设计室2.0,AI数字人生成工具DreamAvatar,美图AI助手RoboNeo。
属实是美颜P图领域的AI春节了。
“懂美”的AI视觉大模型
先来看看AI视觉大模型MiracleVision。
据美图表示,这是国内首个懂美学的AI视觉大模型,“融入了美图长期积累的美学认知”。
除此之外,团队还搭建了基于机器学习的美学评估系统,为模型生成结果打上“美学分数”,从而不断地提升大模型对美学的理解。
数据和评估结合,使得视觉大模型MiracleVision具备了独特的美学创作者生态。
不仅如此,还有不少艺术家、设计师等具有深厚美学背景的专业人士,都共同参与到视觉大模型的建设中。
美图介绍称,MiracleVision具有强大的视觉表现力和创作力,能从绘画、设计、影视、摄影、游戏、3D、动漫等视觉创作场景反推技术演化。
与市面上其它大模型不同,它尤其擅长亚洲人像摄影、国风国潮、商业设计等生成方向。
美图公司创始人、董事长兼首席执行官吴欣鸿认为:
好的视觉大模型,需要有良好的“模型生态”支撑,这个过程离不开创作者和开发者的持续参与。
美图将通过模型的训练、分发和商业化,体系化构建模型生态。
连发7个影像AI生产力工具
包括MiracleVision在内,美图最新发布的7款影像生产力工具,均以AI为内核。
行业则覆盖视觉创作、商业摄影、专业视频编辑、商业设计等领域,目的是全面提升影像行业的生产力。
据美图介绍,目前公司已经正式形成由底层、中间层和应用层构建的AI产品生态。
应用层,美图通过WHEE、美颜相机、美图云修、Wink、WinkStudio、开拍、美图设计室2.0、DreamAvatar数字人等产品和服务,在AI图片、AI视频、AI设计、AI数字人四大领域创新探索,并由美图秀秀提供AI影像服务聚合。
中间层,由美图AI开放平台、美图创意平台、美图AI助手RoboNeo组合而成,分别负责开放共享AI技术、搭建创作者生态、聚合美图影像服务。
底层,则是视觉大模型MiracleVision,为美图全系产品提供AI模型能力。
吴欣鸿认为,在AI与影像生产力工具的紧密结合下,优质内容的创作门槛将不断降低,影像行业的生产效率也将不断提升
推荐阅读
欢迎大家加入DLer-计算机视觉技术交流群!
大家好,群里会第一时间发布计算机视觉方向的前沿论文解读和交流分享,主要方向有:图像分类、Transformer、目标检测、目标跟踪、点云与语义分割、GAN、超分辨率、人脸检测与识别、动作行为与时空运动、模型压缩和量化剪枝、迁移学习、人体姿态估计等内容。
进群请备注:研究方向+学校/公司+昵称(如图像分类+上交+小明)
👆 长按识别,邀请您进群!