链接:https://www.zhihu.com/question/451498156/answer/1802577845
编辑:深度学习与计算机视觉
声明:仅做学术分享,侵删
作者:桔了个仔
https://www.zhihu.com/question/451498156/answer/1802577845
对于解释性有要求的领域,基本深度学习是没法和传统方法比的。我这几年都在做风控/反洗钱的产品,但监管要求我们的决策要可解释性,而我们曾经尝试深度学习,解释性很难搞,而且,效果也不咋地。对于风控场景,数据清洗是非常重要的事,否则只会是garbage in garge out。
在写上面内容时,我想起前两年看的一篇文章:《你不需要ML/AI,你需要SQL》https://news.ycombinator.com/item?id=17433752。
作者是尼日利亚的软件工程师Celestine Omin,在尼日利亚最大的电商网站之一Konga工作。
我们都知道,对老用户精准营销和个性化推荐,都是AI最为常用的领域之一。当别人在用深度学习搞推荐时,他的方法显得异常简单。他只是跑了一遍数据库,筛选出所有3个月没有登录过的用户,给他们推优惠券。还跑了一遍用户购物车的商品清单,根据这些热门商品,决定推荐什么相关联的商品。
结果,他这种简单的而基于SQL的个性化推荐,大多数营销邮件的打开率在7-10%之间,做得好时打开率接近25-30%,是行业平均打开率的三倍。
当然,这个例子并不是告诉大家,推荐算法没用,大家都应该用SQL,而是说,深度学习应用时,需要考虑成本,应用场景等制约因素。我在之前的回答里(算法工程师的落地能力具体指的是什么?),说到过算法落地时需要考虑实际制约因素。
而尼日利亚的电商环境,依然出于非常落后的状态,物流也跟不上。即使使用深度学习方法,提升了效果,实际对公司整体利润并不会有太大影响。
所以,算法落地时必须「因地制宜」否则,又会出现「电风扇吹香皂盒」的情况。
某大企业引进了一条香皂包装生产线,结果发现这条生产线有个缺陷:常常会有盒子里没装入香皂。总不能把空盒子卖给顾客啊,他们只得请了一个学自动化的博士后设计一个方案来分拣空的香皂盒。
博士后拉起了一个十几人的科研攻关小组,综合采用了机械、微电子、自动化、X射线探测等技术,花了90万,成功解决了问题。每当生产线上有空香皂盒通过,两旁的探测器会检测到,并且驱动一只机械手把空皂盒推走。
中国南方有个乡镇企业也买了同样的生产线,老板发现这个问题后大为发火,找了个小工来说“你他妈给老子把这个搞定,不然你给老子爬走。”小工很快想出了办法他花了190块钱在生产线旁边放了一台大功率电风扇猛吹,于是空皂盒都被吹走了。
(虽然只是个段子)
深度学习是锤子,而世间万物不都是钉子。
作者:LinT
https://www.zhihu.com/question/451498156/answer/1802516688
这个问题要分场景看。深度学习固然免去了特征工程的麻烦,但是在一些场景下应该很难应用:
1.应用对时延有高要求,而对精度没有那么高的要求,这时简单的模型可能是更好的选择;
2.一些数据类型,例如tabular数据,可能更适合使用基于树的模型等统计学习模型而不是深度学习模型;
3.模型决策有重大影响,例如安全相关、经济决策相关,要求模型具有可解释性,那么线性模型或者基于树的模型,相对深度学习是更好的选择;
4.应用场景决定了数据采集难,使用深度学习有过拟合的风险。
真实的应用都是从需求出发的,抛开需求(精度、时延、算力消耗)谈表现是不科学的。如果把问题中的『干翻』限定到某个指标上,可能讨论范围可以缩小一些。
作者:RandomWalk
https://www.zhihu.com/question/451498156/answer/1805409808
1.数据充足的情况下,我相信深度学习效果一定会比单层模型或其他非神经网络好。
2.很多实际遇到的问题其实数据很少,这时候就得上规则+简单线性模型/树模型之类的了。
3.大家现在一般指的“可解释性”应该是说某些因子的追溯。这个事情我感觉主要还看问题和模型的复杂程度。如果一个模型变量就有几万个的话,即使是逻辑回归或者层数多一点的树模型也很难“解释”吧。如何解释和溯因对于所有统计模型应该都是一个值得研究的问题。
作者:邱昊晨
https://www.zhihu.com/question/451498156/answer/1806086784
这个问题问得太宽泛了,实际上:
1.“不如”有很多层面,效果、效率、解释性、可维护性、可商业化程度 等等,我们常见的搜索广告推荐等AI技术在单一产品里做深就可以保证带来足够的利润了,但是大量的技术需要商业化的支持才能实现普惠和反哺,这就决定了工作的目标就是不一样的。
2.也不要把深度学习和传统方法对立起来,比如LSTM可以加CRF,比如Facebook几年前还拿GBDT+LR来做点击率。你要说LR不是深度学习,确实不深,word2vec也就一层,那就加MLP呗
3.在其他因素相同的前提下,深度学习一定是传统方法的超集,但是这个前提太难了。在实际工业场景中,有很多因素需要tradeoff
我提一个工作中遇到的真实情况,这些年很少见类似的任务,2020年开始有些火了,document intelligence相关。
大量的word文档,需要提文档的标题
某知名团队的做法是:用tika解析word文档 -> NLP任务建模,对于单行的文本很好处理,但是有些时候一个文档标题会被拆成多行,这种情况下模型就复杂了
我们的做法:openoffice解析word文档 -> 用字体大小、居中等特征,确定文档标题,这样那种一个标题分好多行的case也就迎刃而解了
小刀可以切苹果,瑞士军刀也可以。用瑞士军刀去切苹果,其实是另一种意义上的“不动脑筋”
作者:偏执数学的人https://www.zhihu.com/question/451498156/answer/1802888939
数据量充足的情况下从效果上的干翻确实不常见,更多是从业务场景上的考虑需要工程师去使用传统的办法。
传统信贷风控分。这块内容还是非常注重可解释性的能力的。部分银行会希望自己的模型的开发是基于统计模型比如评分卡模型。但是现在专业的风控公司也在拥抱更多的算法。之前做过图算法在这个领域的落地算是我接触到的一个模块吧。
之前实验室做过lstm对高频数据的分析的项目,效果比不上xgb跑出来的结果。但是这个不知道是特征做的不到位还是别的原因。
作者:匿名用户
https://www.zhihu.com/question/451498156/answer/1802546752
一般传统场景,或者说图片文本信息没那么重要的场景,如一般商品推荐,风控等,传统方法都能比深度学习在短时间内获得更优更鲁棒的效果。
当然持续优化的话,深度模型一般能超过传统模型,毕竟说到底深度学习代表的是一大类方法+一大堆trick,那么大的空间,总有一个组合试出来能赢。
☆ END ☆
如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 mthler」,每日朋友圈更新一篇高质量博文。
↓扫描二维码添加小编↓