【人工智能】3步将深度学习应用到你的商业中

原文标题:Here's how you can leverge Deep Learning in your bussiness

翻译:申利彬

校对:白静

作者:George Seif

本文带大家三步了解深度学习在商业中的应用方法。



深度学习是大家谈论的热门话题,利用深度学习不仅解决了很多现实难题,还让很多新的创新成为可能。强有力的盈利商业模式正是以给人们解决问题、为客户带来价值为基础的。


深度学习在很多任务上表现的很好,例如,语音识别、图像分类、聊天机器人,等等。但是,我们该怎样使用这种技术?如何把它应用在自己的商业中呢?下面我会指导你如何做到,并用流程图直观表达这个过程。



第一步:获取数据


深度学习融入商业的第一步是获取极其重要的数据。深度学习发挥作用,能够很好解决有价值的问题,主要归功于数据。最好的深度学习模型是基于监督学习,也就是说,这些模型达到很好的性能需要大量标记数据。简而言之,我们需要给深度学习“机器”很多“燃料”,它才能很好的工作,这种“燃料”就是数据。


告诉你一个好消息,大多数情况下数据都是现成的。有很多公开可用的标记数据集,这些数据集被收集起来用于训练深度学习模型,再应用到普通的应用程序。有很多关于图像分类、语言翻译、聊天机器人、自动驾驶的数据,可以用在应用程序上。


这是深度学习数据集的快速学习资源:


http://bit.do/Deep-Learning-Datasets(资料很全,值得收藏)


假如你遇到不常见的情形,有个特定的应用,很具体,但是没有公开的大数据集,该怎么办呢?我们可以制作自己的数据集,数据收集不再像以前那么具有挑战性。在这种情况下,网络爬虫工具可以发挥绝佳作用。Adrian Rosebrock有一个很好的教程,关于如何自动爬取Google图片并建立自己的数据集。


http://bit.do/Scrape-Your-Dataset. (教程地址)


可以用群智工具标记大量数据,例如,亚马逊的Mechanical Turk,它的目标是获取足够的数据,建立一个极简可用的产品 (MVP)。


你肯定好奇,到底需要多少数据。这儿有一个不错的方法可以做出估计:找一个相似的任务,看看别人处理问题用了多少数据。除此之外,通常情况下数据越多越好,只要你不是得到负反馈。


第二步:开发深度学习产品


有了标记数据,可以全力开发产品。使用之前的数据训练深度学习模型,并用该模型完成特定任务,最终给客户带来价值。深度学习最擅长处理那些重复的任务,这些任务呈现出多种多样的模式。因此需要关注在必要知识和执行方面重复率都很高的自动化任务,通常情况下这些任务还需要大量人类努力或特定技能。这样,你把提供给客户的价值最大化,如果客户不使用你的深度学习产品,那就不能享受到这些价值。


第三步:客户驱动的正反馈循环


在这个阶段,通过几个关键步骤把深度学习应用在商业中。你已经收集了数据并用它来训练一个深度学习模型,然后用这个模型助力产品,产品性能表现很好并给客户带来价值。现在是最重要的部分,正反馈循环。


开始把产品交付客户使用,有的客户喜欢用,也有的不喜欢,但这都是一个学习过程。非常重要的是,一个新的客户也就是一个新的数据来源,它可以进一步提高深度学习模型的准确率,进而优化产品。所以,关键是有效率的获取新数据。


第一次开发一个极简可用的产品(MVP)时,你可能会为你的定制产品使用公开的数据集或自己爬取数据集,不管是哪种情况,你的数据都足够训练一个好的模型并开发出MVP。但如果想优化产品,数据可能是不够的。比如,你使用了公开的数据集,这些数据可能不包含特殊场景。你可能在家里安装了人脸识别系统,系统识别出人脸时才会把门打开。如果你使用的数据集只有清晰的人脸图片,那系统可能会在雨天或者晚上失效,顾客也就会被锁在门外。另一种情况是你自己爬取数据集,你的目标是获得足够数据,开发出一款极简可用产品(MVP)。这两种情况都表明:更多的数据有可能优化你的模型。也有研究证明,更多的数据有助于改进深度学习模型:


https://arxiv.org/abs/1707.02968v2(论文地址)


既然你的产品掌握在付费客户手中,那么他们就是你获取新数据的最佳资源。客户会定期使用产品,这样就可以获得更多的数据。还记得那个在雨中人脸识别失败的例子吗?为什么不把这些失败的数据加入训练集,帮助训练提高深度学习模型的精度!可以收集那些在雨中和夜晚失败的数据,并标记它们,用这些新数据优化模型。每当系统出错,就有得到新数据的机会,标记这些新数据,重新训练模型,可以实现从错误中学习。当然。也可以在成功的数据中运用这些方法,收集数据并使模型在那些情况下的表现更加稳定。


整个流程创造了正反馈循环,顾客就是驱动循环的人。数据越多,产品越好。产品越好,客户越多,客户创造更多有价值的数据助力深度学习产品。


结束语


现在了解了整个流程,可以开发一个产品,既能实现自我防御,还能由连续循环的数据和深度学习驱动,给客户带来巨大的价值。


原文地址:https://towardsdatascience.com/heres-how-to-leverage-deep-learning-in-your-startup-9204666a3272


申利彬,研究生在读,主要研究方向大数据机器学习。目前在学习深度学习在NLP上的应用,希望在THU数据派平台与爱好大数据的朋友一起学习进步。




张钹院士:浅谈人工智能与大数据的关系

来源:联合时报

本文主要浅谈了人工智能和大数据的关系以及中国在人工只能领域对世界的超越。



中国科学院院士张钹对国内外人工智能产业发展现状,提出我国仅靠跟随性的应用深度学习发展人工智能,是无法引领这项技术实现革命性突破的。语音也在里面学,文字也在里面学,图像也在里面学,会不会互相干扰呢?其实不仅不会互相干扰,在一定程度上还略微有帮助。北美已在引领这些发展,如果中国只低头用深度学习去解决应用问题,不去研究一个目的背后需要解决的问题,要做到“引领”则是不可能的。

 

为什么机器下围棋能超过人类;为什么在图像识别的某些方面会超过人类,成功的因素是什么?我认为有三大法宝:数据、计算资源和算法。这就是深度学习成功的三大法宝。大家对于前两个方面比较注意、有体会,很多人还没有体会到算法的重要性。

 

在这里主要是谈人工智能和大数据的关系,以及中国在人工智能领域如何赶上和超过世界的先进水平。

 

深度学习有三大法宝

 

首先认识一下基于大数据的深度学习。深度学习的提出,在人工智能领域中是一个重大突破。以往,人工智能只能用来解决人们对它非常了解,而且能够清楚地将它表达出来的问题。但深度学习拓展了人工智能所能解决问题的边界。


其次,深度学习具有一定的通用性。比如,人们用深度学习做图像识别,不一定要具备非常丰富、专业的图像知识。即使你不是这个领域的专家,也能把深度学习应用到这个领域。所以,深度学习是一种大众化的工具,它把解决问题的领域大大延展了。对大众而言,这些奇迹引发人们认识到了深度学习的威力。就是在图像识别领域,在某一个图像库里,机器识别准确度略微超过人类,或者机器的误识率低于人类,微软做的工作、百度在语音识别上的工作,识别错误率略低于人类,在两个领域的识别上机器都超过了人类。


现在要分析两个问题:

 

第一,大家都希望把深度学习的方法用到其他领域可能会产生新的奇迹,这些奇迹会不会发生,在什么样的情况下会发生;


第二,如何推动深度学习继续向前发展。


这些奇迹来自何处?为什么机器下围棋能超过人类,为什么在图像识别的某些方面会超过人类,成功的因素是什么?我认为有三大法宝:数据、计算资源和算法。这就是深度学习成功的三大法宝。大家对于前两个方面比较注意、有体会,很多人还没有体会到算法的重要性。我用阿尔法棋作为例子,具体谈谈它怎么来使用这三个法宝。


阿尔法棋用了两个多星期的时间,学了七千万局棋局。机器还自己跟自己下,跟李世石下之前也下了千万局的棋局。也就是说比所有的棋手多下了几千万局的棋,最后的结果是4比1战胜李世石。最好的棋手一生中所下的棋局是百万级,而阿尔法棋下过的棋局是几十亿级的,这两项数据非常不对称,人类绝对会输。这里可以看到数据的力量和计算资源的力量,大家没有看到背后算法的力量。但阿尔法棋能够在两三周里学到几千万个棋局,靠的是什么,其实是靠学习算法,它自己跟自己下棋,靠的是什么,靠的是强化学习算法,没有这些,它是做不到的。

 

人工智能目前做不到举一反三

 

是不是所有问题,只要有数据,就能够做到这么好呢?不是!这要受四个条件限制:


首先是需要有大量的数据,第二是完全信息,第三是确定性,第四是单领域和单任务。只有这四个限定条件达成后才有可能做到刚才说的,达到或者超过人类的水平。有很多问题(同时)符合这些条件,比如说医疗数据,可以做大数据处理,像某些疾病的医疗诊断、医疗图像的识别、医学图像识别等等,只要(问题领域)符合这四个条件,都可以做,而且经过努力,依靠那三大法宝是可以达到或者超过人类的水平。但是,大量的工作并不符合以上四个条件,不符合中间一条两条或者四条都不符合,如果一旦不符合这四个条件中的任何一个,现在的人工智能技术就有困难。


对此,大家以往一直感到困惑,语音也在里面学,文字也在里面学,图像也在里面学,会不会互相干扰呢,过去我们怕装不同东西的时候它会乱了,会互相干扰,其实不仅不会互相干扰,在一定程度上还略微有帮助。北美已在引领这些发展,如果中国只低头用深度学习去解决应用问题,不去研究一个目的背后需要解决的问题,要达到引领是不可能的。


深度学习也不是完美的。很多人以为用深度学习去做产业或者应用不会有问题,但是这里要强调,深度学习有大量的隐患,这些隐患在很多应用场合下是绝对不允许的。首先,它需要大量的样本,有些问题很难获取很多样本,比如特殊疾病,罕见疾病,根本没有那么多样本。最重要的是,不可理解性,现在看到深度学习建立的系统,实际上跟人的思路很不一样。因此,说机器识别能力超过了人,这只是在非常特定的环境下说,其实很多方面它不如人。比如它识别率比人高,只是说它区别马和牛的能力比人高,就是在一定的数据库下它识别能力比人高,但是它根本上不认识马和牛。将来如果做一个人机决策系统,机器做出来的决策,人都不知道它怎么做出来的,那怎么用呢,谁敢用呢?


机器和人如何相互理解

 

现在实际要解决的问题就是人和机器能够合作的问题。大家都在强调,今后的方向肯定是人和机器合作,要各展所长,这里面有一个问题就是机器如何理解人,人如何理解机器。过去的重点是放在机器如何理解人上面,比如说人类的语音命令,用自然语言发的命令它能够听懂,这是所谓自然语言对话。这其实忽视了一个非常重要的另外一个点,就是人如何理解机器,这是由深度学习引起的,因为深度学习出来以后,它做出来的事情人非常不理解,这就给人机共同合作带来了巨大的困难,所以现在很多的重点除了做自然语言理解,理解用户的意图等等这些工作外,还要集中在人如何理解机器这方面。


为什么会发生这种情况,为什么机器的思路跟人不一样,因为机器处理的方式要用专业的语言。机器怎么识别猫呢?它只是从一些局部的特征,局部的纹理来识别它,它根本不是从猫的整体来识别,因为机器要取得整体的特性是非常困难的,它只取得局部的特性,所以它都是在利用局部特性,在一个特征空间里去认识猫,跟人认识猫的角度完全不一样,人认识猫是从所谓语义空间里,是通过它的各种各样的属性来识别它。



目前,这些研究不仅只是大学或者科研机构的事情了,企业也都在纷纷参与。我有个团队也是围绕上面的问题,重点是如何突破将来人工智能要解决的基础和关键问题,而不仅只是低头跟随性地应用深度学习,只有从这点上着手,我们才有可能实现在人工智能领域追赶、超过或引领 的目标。






人工智能赛博物理操作系统

AI-CPS OS

人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。


AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。


领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:

  1. 重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?

  2. 重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?

  3. 重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?

AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:

  1. 精细种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。

  2. 智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。

  3. 高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。

  4. 不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。

  5. 边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。

AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:

  1. 创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;

  2. 对现有劳动力和实物资产进行有利的补充和提升,提高资本效率

  3. 人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间


给决策制定者和商业领袖的建议:

  1. 超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;

  2. 迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新

    评估未来的知识和技能类型;

  3. 制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开

    发过程中确定更加明晰的标准和最佳实践;

  4. 重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临

    较高失业风险的人群;

  5. 开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。


子曰:“君子和而不同,小人同而不和。”  《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。


如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!


新一代技术+商业的人工智能赛博物理操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。





产业智能官  AI-CPS



用“人工智能赛博物理操作系统新一代技术+商业操作系统“AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链




长按上方二维码关注微信公众号: AI-CPS,更多信息回复:


新技术“云计算”、“大数据”、“物联网”、“区块链”、“人工智能新产业:智能制造”、“智能农业”、“智能金融”、“智能零售”、“智能城市、“智能驾驶”新模式:“财富空间、“数据科学家”、“赛博物理”、“供应链金融”


官方网站:AI-CPS.NET




本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!



版权声明产业智能官(公众号ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值