前两天,中哥的手机里突然弹出了这个消息。
《揭秘吻戏鉴定师:日常操作是看人接吻》
中哥一下子就从椅子上勃了起来。纳尼,还有这种羞羞的操作??我当时就觉得,这位眼神坚毅中带着柔情的老湿傅可能要火。。。
有关这位“吻戏鉴定师”的新闻报道
我冷静了一下,仔细看新闻,原来老湿傅是一位算法工程师,日常工作之一就是用极骚极骚的算法,一秒找到特定的人物或者情节(例如吻戏,或者其他戏。。。),以方便编辑们剪辑预告片或者集锦。
天底下还有这么福利的工作?作为一个在五湖四海寻找技术大牛的人,中哥当时就决定,老湿傅这位朋友,我交定了。
于是,我带好手纸,几经易容,飞檐走壁,摸到了老湿傅的办公室,摸到了这位老湿傅的脸颊。
以下就是我的经历。。。。
-----全程高能的分割线-----
(0)中哥鉴吻奇遇记
老湿傅名叫吉恒杉。
听到他的名字,中哥突然有点走神,想到了前两天的毛不易。。。
不不不,这不是重点。
同事告诉我,吉恒杉此时正在会议室面试一群帮他做吻戏鉴定的新童鞋。卧槽,一群??听起来还有意外收获!不过终归不能直接冲进去参观面试,于是我决定马上到会议室外面刺探一下情报。
我才发现这是我人生中见过的最奇葩的面试。
面试的要求是这样的。。。
而面试的现场是这样的。。。
看不清面试的试题吗?我给你放大一下:
纳尼,这些人不都是章子怡吗?
这些有点像杨幂的女纸都是谁啊?
以上的题目,扶着桌子仔细看还能看懂,那么谁能出来解释一下,接下来这个是什么鬼?
看了三十分钟,我只排除了一位,,,五号图里的白衣男子应该不是蔡徐坤。对不起我尽力了。。。
你中哥是个脸盲。说实在的,明星咱也见过不少,立花美凉大桥未久天海翼冲田杏梨三上悠亚,但是无论欣赏多少作品,都并不能帮我分辨出她们谁是谁。。。每次看到她们,都硬了纳兰容若那句话:“人生若只如初见”。
然鹅,这些面试者却个个都是“娱乐圣手”,不仅能认出蔡徐坤的背影,连其他几个背影属于谁都能认出来。
我看着看着,情不自禁地跪下了。。。
等等,这位大哥你也是来应聘的吗?你为什么晒得这么黑?你也能认识大幂幂吗?
仔细打听才知道,这位宅男来自刚果,他之所以能认识中国明星,是因为他的中文都是看剧学会的。。。。
看着他们神奇的认脸特异功能,走位风骚我根本插不上嘴的对话,中哥只能说:对不起打扰了,我走错片场了。。。
好不容易等到面试结束,老湿傅才拉着我的手,给我讲了他一步一步成为“鉴吻师”的心路历程。
吉恒杉 我敬仰的一位老湿傅
PS By 中哥
(1)老湿傅的“鉴吻之路”
吉湿傅是个80后,北航计算机视觉系的研究生。
懂行的浅友听到这句,估计已经开始心跳加速了,因为北航的计算机视觉系相当于台球界的戴维斯,套套界的杜蕾斯,手机界的乔布斯,哲学界的马克思。。。
吉湿傅的手艺有什么呢?他能在视频里给长城贴上瓷砖;也能在视频里给黄河安上护栏。至于从五十集电视剧里挑出吻戏,从一百部电视剧里找出所有范冰冰的戏份,更是不在话下。
在毕业之前,其他同学还忙着研究速8和汉庭哪家有折扣的时候,吉湿傅就已经在各大企业走穴,为他们讲计算机视觉的课赚外快了。
你看,人和人的差距就是这样拉开的。
吉湿傅2016年毕业,第二年就加入了该视频网站,毕竟“计算机视觉”大咖,和视频第一网站配一脸。
一日,吉湿傅正在屋中闷坐,忽见产品经理杀将进来,劈头就问:
网站的编辑们每日剪辑预告片好生辛苦,为寻得一个镜头直找得天昏地暗人畜不分,不知少侠可有妙计否?
这里暂停一下,中哥要多解释几句原理。
编辑们要做的预告片,大概是下面这种:
https://v.qq.com/x/page/n0720vzs2zn.html
你看,都是些打打杀杀亲亲我我的镜头,激动得不要不要的。
不瞒你说,中哥曾经做过视频编导。实际上,预告片的剪辑都是有套路的:
1、一部片子,真正撩动观众内心的,往往是“高潮”部分。。。(你懂的)
2、“高潮”部分,往往是情感(或者动作)很激烈的。。。(你也懂的)
3、要想抓住追剧人的心,让他对下一集充满期待,就要把“高潮”部分都塞进《下集预告》里。
4、所以,过去网站编辑的日常操作,其实就是把一集剧从头到尾都看一遍,然后记下“高潮”部分的位置,最后统一剪进预告片里。
好,回到产品经理和吉湿傅对峙的画面。
吉湿傅捻了捻手中的鼠标,嘴角微微上扬,云淡风轻地说:
不就是想让我用技术找出剧集里“高潮”的画面吗?好办。
当时吉湿傅应该就是这个表情
显然,一个剧集的最高潮往往是吻戏。于是,他就这样愉快地决定了:从吻戏开始找。
(2)老湿傅用什么姿势找吻戏?
刚才说到,吉湿傅“鉴吻”用到的技术是计算机视觉。而计算机视觉属于人工智能的一个分支。
它的大概原理如下:
把大量的各种姿势的吻戏图片输入算法,经过一段时间的训练,人工智能就能从一段视频里挑出吻戏了。这是人工智能的日常操作,不用扣666。
所以,鉴吻的过程其实分三步:
1、标注样本(在海量的图片里,人类先挑出哪些是接吻的照片)
2、算法训练(把这些标注过的样本,输入到算法里训练)
3、机器识别(机器学会之后,就可以帮助人类识别了)
进行到第一步时,吉湿傅就有点犯愁。
啥样的动作叫“吻”呢?
作为一名和浅黑一样严谨的老湿傅,他决定寻找一下“吻”的科学定义。在某度百科上,他发现了这样的介绍:(强烈建议你点开看大图,太刺激了。。。)
不知为何,中哥看完这吻的分类,下意识地咽了一下口水。。。
在和很多男女同事深入交流之后,吉湿傅终于拍板了,只有两个人的嘴唇接触,这才算“吻”。不论多么基情四射,你浓我浓,只要嘴唇没碰上,都不算!
吉湿傅给我看了这张图
据说是和同事们在商量“吻”的标准
按照这样的标准,刚才那张杰克和肉丝的《泰坦尼卡号》宣传图根本就不能算是吻!(真是一个严格的标准。。。)
吉湿傅亲手标注了上千张接吻图片。虽然他已经累得眼冒金星腰膝酸软,但还觉得不够。于是团队找来了一帮职业“数据标注师”帮他标注。最终,两万张接吻的图片就这样排着队被输入系统。
经过一段时间的机器学习,吉湿傅和同事们激动地趴在屏幕前等待最终识别效果。。。
果然,
效!
果!
奇!
佳!
妈妈再也不用担心我学不会接吻了。。。
仅仅这一项黑科技,就能让编辑们过去两眼发蓝找几个小时的工作瞬间完成。Ta 们欢天喜地,纷纷把吉湿傅的相片供在自己的工位上。
编辑们随即发现,这么好的技术,不用到极致就太可惜了。几天以后,他们又有了更多奇葩的需求。
你能帮我挑出所有视频里的蔡徐坤吗?
你能帮我挑出视频里范冰冰被虐时表情痛苦的镜头吗?
你能帮我找到 NBA 里所有詹皇的镜头吗?
吉湿傅推了推眼镜:没问题,但你们要答应我一个条件!
众编辑:大侠请讲,万死不辞!
吉湿傅:给我找几个阅片无数,识明星水平稳如狗的童鞋来帮我做数据标注!
于是,某酷火速在全网发布召集令,才出现了之前奇葩的面试这一幕。
(3)识别明星脸,老湿傅也差点跪了
好了,现在主要矛盾从“如何用人工智能鉴吻”变成了“如何用人工智能识别明星脸”。
我们再复习一下,人工智能识别人脸分三步:1、数据标注。2、算法训练。3、智能识别。
让人工智能认识明星脸,在算法上固然有一定的难度,但是最大的挑战还是在于第一步:数据标注。
@@@首先,这么多明星,一般人未必都认得出来。。。
这是我在某酷会议室
墙上拍到的一票明星
当然,这个问题只能靠人来手动解决。新招聘来的“追星标注员”,就是用来解决这个问题的。
@@@其次,即使是同一个明星,她的长相也是会变的。。。
你看,安其拉宝贝过去的长相和现在的长相,是有一些小小的差距的。明明不是一个人,你却非要告诉机器这是一个人,人工智能是会凌乱的。
吉师傅才发现,原来代码一直清如雪,复杂从来是人心。。。
一个人有好几张脸,这不科学啊。。。眼看自己要跪,老湿傅的求生欲突然爆发,想到了一个自救的神方法。
首先,他把此人分为:安其拉宝贝1、安其拉宝贝2、安其拉宝贝3;
然后,他干脆把这三个人按照三个不同的明星标注,然后让机器按照三个人来识别。
最后,在输出结果的时候,再强行把她们统一输出为安其拉宝贝。
吉湿傅告诉我,虽然经历了一些坎坷,但结果喜人。
目前已有的数据标注师,配上他所在的人工智能团队的回春妙手,已经能达到从一个视频里识别某个明星95%以上的准确率了。
未来,这些通过看手和看后脊梁都能认识明星的数据标注师如果加入战斗序列,简直无法想象他们能做出什么来。。。
所以,下次你再在某酷里看到什么《蔡徐坤玉背合集》《吴亦凡玉手合集》之类的神剪辑,请保持冷静,它们背后可能就是吉湿傅和那些数据标注师的骚操作。
(4)老湿傅还在进行新挑战。。。
正经地说,吉湿傅参与研发的这套“人工智能系统”的最重要作用,就是大大解放了人力,把本来需要人类花很长时间做的事情,用一秒钟的时间做完。
这样理解的话,才能明白这项技术的前途有多广大。
这种技术在体育比赛和游戏里也很有用啊。举几个栗子:
1、比如你可以瞬间找出一场足球比赛里所有的射门、红牌、越位,从而很快地生成一场球赛的花絮集锦。
2、比如你可以瞬间找出一个球员在一个赛季所有的精彩动作。
3、比如你可以找到一赛季 NBA 里某位球员的所有投篮。
4、比如你可以从一场吃鸡游戏的视频里,找到所有女装大佬的近身肉搏镜头。
实际上,就在2018年的世界杯,他们已经在这么做了。每场比赛结束之后十秒钟,它的所有精彩镜头集锦视频就已经被传上了。这当然就和吉湿傅以及同事们的努力是分不开的。
吉湿傅偷偷告诉我,目前他还在研究一项黑科技,那就是:
让机器自动用语言描述一段视频里的内容。
乍一听,好像没神马卵用,其实你错了。
如果这项技术成熟了,在未来的某一天,你甚至可以直接在网站里用文字描述一段情节,比如:
“朱一龙和白宇在宇宙中深情对视”
然后,你就可以直接找到这部剧,这一集,这一分钟,这一秒的剧情。。。
想到这,我惊呆了。
为了实现这个新目标,吉湿傅现在每天都在研究国外最新的论文。
其实,吉湿傅的日常本来就是不断跟踪各大人工智能和计算机视觉的顶级会议,然后研究论文,打磨算法。
他忍不住跟我吐槽。
在别人眼里,我的日常工作是这样:
但是,我真实的日常工作是这样的:
我特意仔细看了一下他日常学习的论文,风格如下:
你看,“鉴吻”这个词听起来轻松加愉快,背后不正是这种辛勤的付出和学习么。
一分耕耘一分收获。圣人诚不我欺啊。。。。
----高能结束的分割线---
告别了吉湿傅,中哥若有所思。
首先,其实我内心里特别希望吉湿傅身体健康心情舒畅万事如意,等到有一天政策允许的时候,他能亲手帮我识别一套《苍老师特殊操作大合集》。。。
其次,我觉得非常幸运。因为我亲眼见证了科技在一点一点拓展我们文明的边界。
以往“追星狗”、“游戏宅”在很多人眼里几乎就是撸瑟的代名词。
但是,科技的发展,让剧情发生了神反转。他们作为“数据标注员”的工作将会深刻地改变了每个人的生活,他们的价值无法被其他人替代。
于是我开始相信:
一个更好的时代,
意味着更多的人可以自由地追逐自己的爱好,
与此同时,他们有权用它证明自己的尊严和价值。
谁说科技没有温情的一面呢?
再自我介绍一下吧。我叫史中,是一个倾心故事的科技记者。我的日常是和各路大神聊天。如果想和我做朋友,可以关注微博:@史中方枪枪,或者搜索微信:shizhongok。
不想走丢的话,你也可以关注我的公众号“浅黑科技”。