浅谈企业如何正确的引入和发展AI算法

在这里插入图片描述

本文主要分为上下两部分,(上)部分主要介绍一下企业内部什么时候需要引入AI技术(这里的AI技术泛指机器学习、深度学习、NLP、视觉、语音、推荐等),(下)部分主要介绍一下在引入这些AI技术之后的一些情况和企业的技术方向发展。

(上)部分

数据积累

当一个产品是以内容为主的时候,必然会积累大量的数据,在这个数据为王的时代,有了数据当前要进行分析、挖掘,然后产出更多的商业价值。这个时候必然需要引入AI技术。

但在数据积累前期,产品、分析、挖掘等更多是基于「规则」进行的。人们总结出一些规则,然后利用编程让计算机自动的去执行这些规则。基于规则的好处是:人们知道在什么的数据条件下,会产出什么样的数据结果,一切皆可判断,可以解释。

当然一些规则会逐渐演变成可解释的、简单机器学习模型,比如KNN、K-Means、贝叶斯等。但是基于规则的方法,很难甚至无法总结出有效的规则。这个时候规则就要退场,并逐渐切换到AI技术。AI技术的最底层的根基便是数据,如果没有数据,何谈AI。

「基于数据」的方法简单说就是:从海量数据中找规律,这些规律是很抽象的,并不能总 结成具象的规则。比如:

  • 给机器看海量的猫和狗的照片,它就具备了「区分猫和狗」的能力
  • 给机器海量的中英文对照文章,它就具备了「中英文翻译」的能力
  • 给机器海量的文章,它甚至可以具备「写文章」的能力

基于数据的好处是:只要有足够多的优质数据,那么机器就能学会某些技能,数据越多, 能力越强。

但是基于数据的方法也有明显的弊端:机器只能告诉你「是什么」,但是无法告诉你「为什么」。这就是模型的不可解释性。表现最突出的就是神经网络相关的算法模型。

上边说了有了数据的时候需要考虑引入AI,但并不仅仅是一些杂乱无章的数据,我们考虑的是数据的四大要素:
数据的四大要素

特征

首先我们要理解什么是特征?比如当听到一个人说着一口流利的东北话,我们就知道他可能来自东北,当看到一个人的头发短、卷,肤色全黑,但牙齿十分洁白,我们就可以猜测他来自非洲。但一个人说着东北话 却不一定是东北人,可能他在东北上学,一个人符合非洲人的特征,也有可能是个混血儿。

上面这个例子其实想要说明两点:

  • 1、AI技术模型的一般流程
    AI算法的一般流程

  • 2、特征是AI算法模型的关键(当我们想要使用一个算法去评估一个结果时,简单几个特征是不够的,我们需要引入更多的特征,同时特征本身的不确定性也对结果有很大的影响)
    特征时AI算法的关键

    • 特征少+确定性弱:适合人工解决
    • 特征少+确定性强:适合规则解决
    • 特征多+确定性强:适合规则解决
    • 特征多+确定性弱:「可以考虑」 AI 解决

但其实还有很多其他因素:成本、⻛险、是否可测量…这里不做考虑,否则太复杂了

模型的不可解释性

在「数据积累」中,提到了模型的不可解释性。不可解释的模型只会告诉你结果「是什么」,而不会告诉你「为什么」会产出这个结果。当我们的不可解释模型中出现badcase时,我们并不能轻易的找到为什么会出现这个问题的原因?同样通常也不能对症下药,因为我们的修改和优化都是针对模型整体而言的。

因此在考虑是否使用不可解释模型去解决一些问题时,需要考虑:

  • 是否需要解释
  • 是否可容忍

两个维度

我们先从这2个⻆度来看看普及率较高的AI应用:

案例 是否需要解释 错误容忍度
语音识别 用户只关心效果好不好,并不关心背后的原理是什么 偶尔出现一些错误并不影响对整句话的理 解。少量出错是可以接受的。
人脸识别 同上 相比语音识别,用户对出错的容忍度要低一些,因为需要重新刷脸
机器翻译 同上 跟语音识别类似,只要大面上准确,并不影 响整体的理解。

再来看一些人力和AI结合的案例

案例 是否需要解释 错误容忍度
智能客服 用户不关心是人工服务还是机器服务,只要能解决我的问题就行 如果机器客服不能理解我的意图,无法帮我解决问 题,用户会很不满意。所以当机器搞不定的时候需要人工来补位
内容审核 对于审核不通过的内容,需要解释原因。通过的内容不需要解释为什么 有一种职业叫「鉴⻩师」,目前正在逐步被机器替 代,但是并没有完全替代,因为有时候机器会拿不 准,这个时候人工来复审

最后看一些不适合AI落地的场景

案例 是否需要解释 错误容忍度
推导定理 科学是绝对严谨的,一定是从逻辑上推导出来的,而不是统计出来的。 如果有例外就不能称作定理,一定是绝对正确没有错误的
写论文 人工智能已经可以写小说、诗歌、散文。但是论文这种文体要求非常严谨的上下文逻辑。 论文里是不允许有错误的,全文的逻辑要非 常清晰,哪怕一个细节出现了逻辑问题,也 会造成整篇论文没有价值。

如果我们把上面提到的案例全部放在象限中,大致如下:
AI落地的评估

所以在评估是否引入不可解释的AI技术时,有下面三个准则:

  • 1、解决方案越需要解释背后的原因,越不适合用深度学习
  • 2、对错误的容忍度越低,越不适合使用深度学习
  • 3、上面2条并非绝对判断标准,还需要看商业价值和性价比,自动驾驶和医疗就是反例。

(下)篇——引入AI后的情况

首先需要明确的是引入AI后并不代表其他劳动可以缺失,AI只是整个内容生产、运营链条中的一环而已,不能凡事都交给AI。

这里插播一个笑话:我经常会听到一些说,AI不是很厉害吗,那xxxx不能用AI解决吗?

是呀,AI技术是能够挖掘和创造一些价值,但AI也并不是万能的。我们要对AI树立正确的态度,合理利用AI技术,继而带来更大的产业价值。

没有任何事情是一蹴而就的,引入AI并不是马上要见到成效。通常的做法应该是这样的:
引入AI

在产品中无论引入什么技术,我们最终需要追求的就是创造价值。只不过规则时代能够创造的价值是有限的,而引入AI技术之后,潜能是巨大的。

技术在企业发展中的过程中主要有两大原则:

  • 1、为企业创造可见的价值(如营收、用户)
  • 2、竖立企业技术品牌,扩大其影响力

2 是建立在1的基础上的,毕竟只有企业生存下来了,才有资格去谈技术品牌和影响力。所以这也就促进了员工在工作期间,不仅要完成工作的内容,同样也要不断学习新的技术,扩展自己的知识面和技术实力。当然如果一个人的目标不是技术,那无可厚非,做自己喜欢的事情就好。

所以一个企业的技术肯定是要不断进步和演化的,不可能固守在规则为王或者简单的可解释算法模型时期,需要引入更加先进的技术,因为其潜在的能创造的价值是无限的。

这才引入AI技术后,企业技术发展的正确方向。


扫一扫 关注微信公众号!号主 专注于搜索和推荐系统,尝试使用算法去更好的服务于用户,包括但不局限于机器学习,深度学习,强化学习,自然语言理解,知识图谱,还不定时分享技术,资料,思考等文章!

发布了320 篇原创文章 · 获赞 480 · 访问量 185万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 大白 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览