知乎李大海:AI 不只是噱头,满足需求才是真落地
https://mp.weixin.qq.com/s/8ONrl8cIU45Hwb4xRBhZnQ
2018年10月17日~19日,由IT168旗下ITPUB企业社区平台主办的第十届中国系统架构师大会(SACC2018)将在北京隆重召开。本届大会包括了核心业务系统架构设计、大数据平台架构、传统企业数字化转型、人工智能应用四大主线。
为了让大家更为深入地了解SACC2018大会的日程设置及专场收益,ITPUB社区&IT168企业级编辑部对十多位出品人和专家顾问进行了系列采访。
本期采访嘉宾:知乎合伙人、高级副总裁李大海,主线4:人工智能应用落地实践(下)专场出品人。
嘉宾简介
李大海,拥有多年的搜索算法经验, 2015年加入知乎,先后负责过广告技术团队、数据、算法和整体社区业务。目前统筹负责知乎大数据团队、内容流通和 AI 新业务的拓展,在相关技术上是不可多得的人才。
知乎,一家非常有硅谷范儿和极客范儿的公司
知乎诞生于2010年,是一家全民知识内容平台,它将知识的价值最大化地挖掘出来,为人人所用,完成知识普惠。知乎高级副总裁李大海表示,知乎是一家非常有硅谷范儿和极客范儿的公司,管理扁平化,崇尚“总搞得定”的海盗文化。知乎将公司的发展和价值观与员工自我成长凝结在一起,一起做有意思又有挑战性的事。
五个月增长6000万用户不是盖的
知乎的最新AI算法应用实践
据了解,今年3月底,知乎注册用户达1.4亿。而经历了五个月后,到8月底,知乎的注册用户数已达2亿,且其他数据也在高速增长。
李大海表示,目前知乎已将AI算法应用贯穿了从内容生产、消费到用户连接与社区治理的多个场景。内容生产场景中,知乎通过AI算法应用自动生成问题,丰富内容维度,同时还将内容快速分发给合适的用户,激发他们的创作欲望;内容消费场景中,知乎通过首页推荐系统“水晶球”、搜索系统,帮助每个用户快速、便捷地获得更多感兴趣、有用的内容;用户连接场景中,知乎上线了用户关注推荐、相似回答者、用户聚类等一系列功能,加强用户之间的联系,推动内容的创作与分享;内容治理场景中,知乎通过综合使用情感模型、用户亲密度模型和文本识别模型,不断优化算法机器人“瓦力”,识别并实时处理不友善、答非所问、阴阳怪气等内容,部分场景准确率达到99.13%,打造专业、认真、友善的社区氛围。
AI不只是一个噱头
真真切切结合问题满足需求才叫真正的落地
AI应用的落地是大家老生常谈的问题,这一两年也让人看到可喜的发展。李大海表示,决定AI应用落地的因素有很多,但有几个关键点:其一,是否具备海量高质量的数据;其二,是否有有效的AI人才培养机制;其三,是否有与业务紧密结合的能力。
判断AI应用落地情况,同样要看这三点。AI不只是一个噱头,真真切切地解决人们周围的问题,满足大家的需求,才叫真的落地。
算法有偏见?人机结合才是有效手段之一
业界流行“算法偏见”一说,AI算法和它们的决策程序是由研发者塑造的,被写入的代码以及后续使用训练数据进行训练等过程,其中任何一个环节不平衡,就会对结果产生很大影响(《八大现象论证人工智能威胁论真的存在》),因此大家对AI的肯定飘忽不定。
对此李大海表示,知乎推动AI应用,目的是构建一个符合知乎社区和内容价值观的平台。但并不代表AI会完全替代人工,知乎的AI应用自始至终都伴随着人的高度参与,人机结合是避免“算法偏见”出现的有效方法之一。
在制定社区规则和具体应用时,知乎的技术团队会不断训练算法,纠正可能存在的偏差,以追求AI应用的正向效果。
AI算法实践两大坑,不要在持续“炼丹”了!
AI算法实践是一个复杂的过程,其中需要注意的“坑”有很多,李大海列举了两个经典的例子,希望能对从业者有所帮助。
一是对“算法”和“架构”看得太过分裂。做算法的同学完全不关心实现,这样做的效率是比较低的,也不利于算法的落地。
二是做得太浅。一些所谓的“算法工程师”,做的事情完全是盲目套用各种模型和各种结构,根据效果随机调整超参,效果好不好完全看天意,这种工程师更像是在“炼丹”,也许最终的产出能够被使用上,但工程师自身不会有太好的成长。