其实这个题目其实早就想探讨一下了,因为工作有时候会在这件事情上花费很多时间。这两天坐着思考了一下,这个问题其实应该分几个维度来讨论。
当然,这里只讨论工业界。
区分目的
首先需要明白,你是要做什么,是要快速落地,还是提升模型效果,还是讲故事,还是做算法可行性研究,都有不同的套路,以及工作中各种形形色色的约束。
讲故事--PPT型
工作中,总要给客户或者领导讲各种的故事,做个看起来fantastic的ppt,以前还没工作多久的时候,对这种事情嗤之以鼻,现在啊,赚钱嘛,不丢人。
因为现在不像以前,故事不是带有AI,听众就使劲鼓掌,让人信服。时代变了,还是得拿点东西出来给别人看的。如何讲一个好的技术性故事,根据我的经验,一定要在吹牛逼和实用性和普及性中间平衡。
举个例子,NLP相关的任务,你给别人讲故事,不要一开始就把rf,word2vec就掏出来,你得讲Transformer,elmo和BERT,但是你又不能讲GPT-2和ERNIE2这种最新模型。
不是因为GPT-2和ERNIE2不好用,甚至ERNIE2对于中文的效果是非常好的,而是说这两个模型对于专门做NLP的人熟悉且好用,而Bert这个名字流传度更广,业界出的成果更多,开发起来更便捷(github上的各类demo源码更多,便于落地),但是相对于word2vec这种老古董更先进。
综合这样,东西可以落地,效果也查不到哪