天对地,雨对风,向量对加班?这个脑洞清奇的对联AI,大家都玩疯了

640?wx_fmt=png

本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处

本文1500字,建议阅读6分钟

人工智能技术应用化日益推进,这次是AI对联。


A:天对地,雨对风。

B:大陆对长空。这我也会。

A:那你出一个我给你对。

B:辣条对什么?

A:额,没学过,我先问问AI。

B:问出来了么?


640?wx_fmt=png


对联秀,开场


AI说,辣条对香茗。


这是一位名叫王斌的有志青年,开发的对联AI


出炉之后,网友一股脑儿的都去调戏AI,网站甚至一度要挂。


640?wx_fmt=jpeg


我也出个认真的上联,考一考它:


640?wx_fmt=png

突发现场:不会数数


不不不,认真的是这个:


640?wx_fmt=png


有道理,梅花开的时节确实不一样。另外,平仄也讲究。


增加难度,上联出个有断句的:


640?wx_fmt=png


山可透光,水不染尘,好一个清明的世界。


如果再配上山花烂漫:


640?wx_fmt=png


来啊,快活啊。老司机啊,动车驾照拿好了吗?(误)


相信我,开车是个意外。


要成为一名德智体全面发展的AI,除了对诗文,也要常练武。


先来一招,猛虎硬爬山


640?wx_fmt=png


名对名,动对动,形对形。矮又与高相映成趣,周全了。


不过,这意思是不想起床?


那可不行,再来一招乌鸦坐飞机


640?wx_fmt=png


这次是坐起来了。但好像也坐得太稳了,菩萨啊。


唉,不爱动就躺着吧,十年一觉扬州梦


640?wx_fmt=png


阿嘞?这样居然跑起来了,还不是短跑。


体能优异,又有爱国之心,成为栋梁之才指日可待。


不过,他日担当国之大任,还需对人工智能领域拥有清晰的认识,并且掌握专业知识:


640?wx_fmt=png

640?wx_fmt=png


额,还是谦虚一点比较好吧。


下面来考学术概念:无监督学习、线性回归、自然语言处理、向量,以及词嵌入。


640?wx_fmt=jpeg


有法可依;


640?wx_fmt=jpeg


民心归之;


640?wx_fmt=png


人生平淡;


640?wx_fmt=png


不想加班;


640?wx_fmt=jpeg


我在问词嵌入,你怎么喝上了?


那就趁着微醺,考察一下对学界和产业界的了解吧:


640?wx_fmt=png


对学术前辈怀有敬畏之情,孺子可教。


640?wx_fmt=png


伯克利......收回刚才的表扬。


640?wx_fmt=jpeg


这是说万古流芳的意思么?


640?wx_fmt=png


你到底信佛还是信道?


640?wx_fmt=png


好的,你醉了,明天再考。


打哪儿来的AI


这个AI的训练,基于深度学习seq2seq模型,用到了TensorFlow和Python 3.6,代码已经开源,你可以自行到文末传送门找到GitHub页面下载开源代码尝试训练。


目前的对联水平,是在Nivida GTX-1080 GPU上训练了大约4天左右的模型。


不过,这个AI对对联的表现还是要看它的“课本”。训练它所用的数据集来自一位名为冯重朴_梨味斋散叶的博主的新浪博客,总共包含超过70万副对联。


然而,由于我们不知道的原因,这位博主的博客已经无法访问了……


640?wx_fmt=png


好在,我们还有万能的度娘,度娘在博客弥留之际留下了一些快照,我们发现,这是这位博主编辑的一部名为《联语杂酱面》的书。


看一看这些珍贵的史料,或许你就明白了上面对联AI的文风是怎样习得的了。


640?wx_fmt=png

640?wx_fmt=png


另外,博主本人还po出了该系列的目录:


640?wx_fmt=png


全文不含标点15,153,840字,如果每天看100条的话,22年都看不完。


然而英伟达的GPU四天就看完了……


看完了……


完了……


还有微软的对联AI


我们今天的对联AI作者是一位名叫王斌的小哥哥,本科毕业于黑龙江大学计算机专业,几年后又到英国莱斯特大学读计算机硕士,现在是一名软件工程师。


640?wx_fmt=jpeg


除了王斌的对联AI之外,AI对联界还有一个著名的作品,来自大名鼎鼎的微软亚洲研究院,是十余年前沈向洋主导的一个研究项目。


微软的对联AI要谨慎且复杂一点,即使你填“辣条”作为上联,它也会给你许多个下联。


640?wx_fmt=png


还能生成横批。


640?wx_fmt=png


微软的研究其实是个古董,2004年沈向洋就提出要做自动对联,第二年的春节就已经申请下了专利。


对联AI的第一版早在2006年就已经上线公开了,我们看到的这一版是2008年的第二版,当时在PC互联网时代,未经主动传播的情况下就取得了5W的单日访问量。


来看看微软AI的代表作:


上联:此木为柴山山出
下联:白水做泉日日昌
横批:景色怡人


上此下木,是为柴;上白下水,是为泉。


能对出拆字联,这位AI老先生的文学造诣可见一斑。


究其原理,我们找到了微软亚洲研究院副院长周明博士的博文《微软对联背后的故事》,文中是这样介绍的:


我设计了一个简单的模型,把对联的生成过程看作是一个翻译的过程。给定一个上联,根据字的对应和词的对应,生成很多选字和候选词,得到一个从左到右相互关联的词图,然后根据一个动态规划算法,求一个最好的下联出来。


传送门


  • 王斌版AI对联

    https://ai.binwang.me/couplet/

  • 开源代码

    https://github.com/wb14123/seq2seq-couplet

  • 训练数据集

    https://github.com/wb14123/couplet-dataset

  • 微软对联

    https://duilian.msra.cn/default.htm


640?wx_fmt=jpeg640?wx_fmt=jpeg

没有更多推荐了,返回首页

私密
私密原因:
请选择设置私密原因
  • 广告
  • 抄袭
  • 版权
  • 政治
  • 色情
  • 无意义
  • 其他
其他原因:
120
出错啦
系统繁忙,请稍后再试