AI 产品经理的时代来了。
「现阶段大多数 AI 产品需求是自上而下的,来自老板给的 KPI**,而不是真实的业务需求。」**
2023 年,凭借对 AIGC 技术的创新应用,「妙鸭相机」在国内市场第一个成功破圈。
抓住写实人像场景的需求,妙鸭自第一天正式上线就开始收费,以「9.9 元实现写真自由」打开大模型 C 端应用的商业市场。而经过国内一年的「百模大战」,行业已经形成了一定的共识:大模型的竞争将集中在头部几家,而专业模型会越来越丰富,在此之上生长的应用层将会更多,行业和用户都在等待着真正的「杀手级应用」出现。
在此方向上,「妙鸭」在爆火之后做了什么?这段成功经历背后有着怎样的产品人才观?AI 时代的产品经理应该长什么样?
12 月 16 日,极客公园创新大会 2024 上,妙鸭产品负责人蔡晓岑带来了主题为「妙鸭相机,9.9 元实现写真自由背后的产品逻辑」的演讲,以下实录由极客公园整理。
01
从 0 到 1,
9.9 元实现写真自由
今天的演讲将为三个部分。
首先,我们将探讨妙鸭相机从 0 到 1 的发展过程中所做出的重要决策,包括选择写实人像的原因、产品定位是如何确定的、我们经历了哪些里程碑。第二部分,会分享在破圈之后,我们做了哪些让妙鸭相机快速成长。最后一部分会跟大家一起聊一聊:作为产品经理我们应该如何在大模型时代乘风破浪。
首先,生成人像的灵感源自于我们内部的 AIGC 研究小组。自 ChatGPT 火爆后,我们一直关注 AIGC 的前沿动态和发展,尤其是在 AI 绘画领域不断涌现令人兴奋的工具,如 Midjourney 和 Stable diffusion。
有一天,我的同事在群里分享了一张特朗普被捕的照片,当时我们都感到惊讶,真的假的?但后来发现是由 Midjourney 生成的。从那张照片开始,我们意识到大型模型可以通过学习照片中的人像特征,生成令人难以分辨真伪的逼真人像。
随后,Midjourney 发布了 V5 版本,能够还原人的皮肤纹理,以及手部等肢体细节。右边的这张中国情侣照片就是使用 Midjourney V5 生成的,非常逼真。然而,像 Midjourney、Stable diffusion 这样的大模型,在生成亚洲人像时更偏向于日韩亚裔的长相,因为它们的模型训练集缺乏中国人的数据。当时国内还没有一个写实的人像模型。
对于阿里大文娱来说,在影视内容领域有许多天然场景适用于这种人像模型,因此我们决定自研一个亚洲写实人像大模型,代号为「提香」。
Midjourney V5 生成的中国情侣照片|极客公园
为什么将这样一个人像大模型应用在 C 端呢?生成人像其实很容易让人联想到照片的形式,因为拍照、打卡是我们生活中常见的记录方式。随着人们对照片质量的要求提升,商业写真和商业摄影市场的份额也在逐渐提升。据公开资料显示,预计到 2027 年,商业摄影市场将达到 6800 多亿元,其中写真、证件照、婚纱照等商业摄影场景占总体市场的四分之三,这样一个市场需求真的很让人兴奋。
作为一个特别爱拍照的女生和摄影爱好者,其实我特别能理解想拍一张好看的照片,有一个靠谱的摄影师是多么重要。现在付费约拍市场已经非常成熟,许多女生都有过到线下摄影工作室拍写真的经历。
首先这过程第一要提前付费约拍,然后要在拍摄当天提前去化妆、换衣服,这一整天下来,其实还只是开始,然后我们选片、后期,经过几天才能拿到最后的写真。这一套下来我们花费少则几百块钱,多还会过万。所以我们能看到其实写真这个行业,存在费时费力又费钱这样真实的用户痛点。
因此,面对这样的市场需求和用户的痛点,我们决定开发一款在线生成写真的 AI 相机,让用户能够高效、快捷、低价地获得真实、美观的照片。我们的 Slogan 也应运而生,「妙鸭相机,你的 AI 摄影师,9.9 元实现写真自由」。
我回顾了一下妙鸭从上线以来的重要里程碑。我们在 4 月初立项,4 月 20 号正式启动开发,一个月左右我们就有了内部可测试的微信小程序版本。然而,那时的写真效果远远达不到我们的标准,因为我们希望用户上线后能有「哇塞」的体验。
我们经过了很长时间的效果打磨,这个过程非常痛苦。我们经常要组织大约几十人一遍又一遍地生成数字分身,然后记录每次数据进行对比实验。我也经常生成一些 AI 照片,结合一些心情文案发到朋友圈,伪装成正常的照片,以便观察朋友的反馈。
起初,一些朋友可能对 AI 有所了解,会问这是最近 AI 生成的吗?我知道这个效果达不到要求,因为有 AI 感。经过打磨,这样的反馈逐渐消失,**有的朋友甚至会问,你出门玩的时候是总带着一个摄影师吗?听到这样的反馈,我对我们的效果已经非常有信心了。**因此,我们于 6 月 30 日上线了微信小程序的第一个版本,内测版免费向大家提供邀请码。
用 AI 生成照片发朋友圈|极客公园
上线半个月后,产品意外走红,受到广泛好评,我们的服务器也爆掉了,算力根本跟不上内测需求量,算力真的太贵了。所以我们 7 月 17 日上线正式版本,9.9 元可以实现写真自由,希望用户用特别低的价格体验到在线生成专业质感写真的 AI 相机。
为了提供更好、更顺畅的产品体验,也为了让大家通过更多渠道触达我们的服务,我们决定推出 App。从决策到上线,我们只用了 4 天时间,你没听错,就是 4 天!是不是有点不可思议?这也是我人生第一次体验到研发团队的效率和爆发力有多强。一个月后,我们的 App 冲上了苹果商店下载榜的第一名,这是妙鸭相机的一个高光时刻。
同时,我们还在做一个创作者生态叫妙鸭 Studio,为用户提供更多丰富多彩的写真模板,同时创作者也能有一份不错的收益。
02
爆火之后,
妙鸭做了什么?
可以说我们的努力加一些幸运成分,让妙鸭相机上线后取得了不错的开始。如何保持用户的热情,增加用户的黏性和付费转化?这实际上是产品能够持续健康发展特别重要的部分。
所以当我们破圈之后,特别关注来自用户的反馈,在拍摄写真场景下提供了许多新的玩法来满足用户需求。另一方面,我们也在探索一些全新的 AI 体验,寻找妙鸭相机在拍写真之外的成长空间。
在拍摄写真场景下,线下摄影机构经常根据节日和用途更新主题和妆造,这是刺激用户反复消费的重要手段。对于我们来说,也会以周更或者日更的频率,向用户提供丰富多样风格的写真模板。
在某些场景下,我们还可以与一些品牌合作,联合打造一些联名款,比如今年的暑期档,我们与携程旅行合作,以旅拍为主题,让大家体验在线旅行,推出云打卡等新玩法。
除此以外,我们还在打造一些线下写真店无法提供的体验,比如在线生成一些 IP 造型同款写真。我们与游戏《永劫无间》推出主角 Cosplay 同款,与综艺《这就是街舞 6》推出站队主题妆造同款。最近热播的剧《新闻女王》,我们也推出女主播同款,让用户可以一键体验自己喜欢的角色,这也是我们 AI 相机独有的优势。
除了拍摄主题之外,我们也不断收到用户的反馈,用户想拍全身照,与家人合影,或者与宠物合影等等,这些诉求也为我们提供了拓宽拍摄场景的路径。
但是我们也面临许多技术挑战,比如最近攻克的难题之一是合影拍摄。与单人照片相比,合影的技术难度呈指数级增加,因为我们需要考虑多人成像的稳定性,包括肢体和服装的稳定性。不过,我们的产研团队也非常给力。就在前天(12 月 14 日),我们上线了邀请朋友一起合影的功能。现在,只需下载最新版本的 APP,即可给好友发送口令码,邀请他们一起合影,体验与闺蜜和家人隔空合影的神奇体验。
此外,我们也在探索除了拍照之外的 AI-native 玩法。我作为一个特别爱拍照,也特别爱美的女生,每次拍照后修图都是家常便饭。先瘦脸、放大眼睛,然后磨皮、去皱,再上妆,再选一个滤镜,一张照片的修图流程需要 10 分钟。发个 9 宫格朋友圈需要一到两个小时的修图时间不足为奇。仔细想想,每次修图过程中 90% 的步骤都是相似的,也就是说每张照片中的妆容和脸型都是根据我的审美标准精修出来的。
换个思路,如果妙鸭相机制作数字分身时,上传的照片都是经过我精修的,算法就能学习到我的脸型、五官和妆容特征。也就是说,我的数字分身已经无形中学会了我的修图秘籍。再结合人脸检测和定位能力,数字分身可以根据我的审美对照片中的人脸进行重绘或微调,实现一键精修。
基于这样的想法,我们进行了许多新的实验,也有一些惊喜的发现。例如,有时拍照时面部表情不太好,或者头发挡住了脸,我们的数字分身可以一键修复五官和表情。
我们刚刚上线了第一个版本的 AI 修脸能力,一共包含四个档次的效果。如果使用手机原生相机拍照,使用轻修可以获得原生肤感效果;素颜照片使用第二档美颜可以一键上妆;朋友拍照未捕捉到你的表情也没关系,我们可以一键睁眼;大风天气拍照时脸上都是头发也没关系,使用重塑功能可以帮你恢复五官。
这个 AI 修脸能力操作非常简单,只需用户上传一张照片,点击修脸即可获得这四种效果。我们希望用这种傻瓜式的、一键式的简单操作来颠覆传统复杂的修图流程。
03
产品经理,
如何面对大模型时代
接下来我想谈一谈作为产品经理,我们在大模型时代应该如何应对。
最近我在招聘我们的 AI **产品经理,发现一个现象,80% 的申请者的 AI 从业经历都是从去年末到今年初开始的。**我一般会问这些候选人两个问题:为什么选择这个应用方向?如果项目效果不好,你觉得问题出在哪里?他们的答案中有一些共性,我进行了提炼。
妙鸭产品负责人蔡晓岑|极客公园
-
第一,现阶段大多数 AI 产品需求是自上而下的,来自老板给的 KPI**,而不是真实的业务需求。**
-
第二,现在所使用的能力大多是开源模型,经过简单的封装就上线,缺乏场景的独特性和技术壁垒。
-
第三,产品经理想实现的功能,会因为所使用的模型准确性不够,导致无法达到应用标准。
通过这些共性能看到大家对 AI 产品经理的定位可能还不是很清晰,只是在追逐潮流,拿着模型来找场景,只做了简单的交互体验的改变,而把最重要的效果寄托在大模型本身上。
我个人做 AI 产品经理已经有 6 年了,我认为 AI 产品不是简单的模型搬运工,**大模型更像是一个全新的工具,取决于使用者对它的了解和改造能力。**所以我认为 AI 时代的产品经理必备两个能力:
-
第一,对算法的技术边界有所认知和了解,知道模型本身能解决什么问题,能否通过微调解决特定场景的需求。
-
第二,带着产品目标和需求去与算法同学一起打磨算法能力。
虽然我们没有算法那么精通技术,但需要具备与算法技术同学同频沟通的能力,了解模型的构建流程,知道如何准备有效的数据集,以及会运用评估模型性能的技术术语和方法。
另外,**做任何方向的产品经理,最核心的是掌握市场趋势判断、洞察用户诉求的能力,带着用户痛点去找答案。**在当前 AI 大模型时代,我认为想转型成为 AI 产品经理的同学,应该在自己熟悉的领域和行业里思考如何与 AI 结合,不要成为模型能力的搬运工,而是带着痛点寻找 AI 的解决方案。
大模型岗位需求
大模型时代,企业对人才的需求变了,AIGC相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
掌握大模型技术你还能拥有更多可能性:
• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;
• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把全套AI技术和大模型入门资料、操作变现玩法都打包整理好,希望能够真正帮助到大家。
-END-
👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓