人工智能和大数据的二三事_智能规则和人工录入的区别-CSDN博客

半个多世纪的某个夏天，麦卡锡、明斯基等科学家们共同研究用机器模拟智能的问题，人工智能，也就是AI的概念被正式提出。如今人工智能的商业化正在快速发展，例如我们熟知的人像识别、图像识别、语音识别、自然语言处理、用户画像等等。对于未来而言，人工智能会在生活的方方面面发挥更多的作用。但是没有先前的大数据技术做铺垫，也不会有今天大红大紫的人工智能。

大数据可以说是人工智能的基石，目前的深度学习主要就是建立在大数据的基础上的。

人工智能主要有三个分支：

1.基于规则的人工智能。

2.无规则，计算机读取大量数据，根据数据的统计、概率分析等方法，进行智能处理的人工智能。

3.基于神经元网络的一种深度学习。

基于规则的人工智能，即在计算机内根据规定的语法结构录入规则，用这些规则进行智能处理，缺乏灵活性，也不适合实用化。因此人工智能实际上的主流分支是后两者。

而后两者都是通过“计算机读取大量数据，提升人工智能本身的能力和精准度”。如今，大量数据产生之后，有低成本的存储器将其存储，有高速的CPU对其进行处理，所以才使得人工智能后两个分支的理论得以实践。

简单来说什么是大数据呢。从字面上来看，大数据被很多人定义成“大规模的数据”，但其实这个说法并不够准确。数据量庞大，并不代表着数据一定有可以被深度学习算法利用的价值。举个例子，地球公转的过程中，每秒记录一次地球相对太阳的运动速度、位置，可以得到大量的数据，但只是这样的数据，它的挖掘价值并不是特别高。

大数据这里我们参阅马丁·希尔伯特的总结，今天我们常说的大数据其实是在2000年后，因为信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数据：

信息交换：据估算，从1986年到2007年这20年间，地球上每天可以通过既有信息通道交换的信息数量增长了约217倍，这些信息的数字化程度，则从1986年的约20%增长到2007年的约99.9%。在数字化信息爆炸式增长的过程里，每个参与信息交换的节点都可以在短时间内接收并存储大量数据。

信息存储：全球信息存储能力大约每3年翻一番。从1986年到2007年这20年间，全球信息存储能力增加了约120倍，所存储信息的数字化程度也从1986年的约1%增长到2007年的约94%。1986年时，即便用上我们所有的信息载体、存储手段，我们也不过能存储全世界所交换信息的大约1%，而2007年这个数字已经增长到大约16%。信息存储能力的增加为我们利用大数据提供了近乎无限的想象空间。

信息处理：有了海量的信息获取能力和信息存储能力，我们也必须有对这些信息进行整理、加工和分析的能力。谷歌、Facebook等公司在数据量逐渐增大的同时，也相应建立了灵活、强大的分布式数据处理集群。

大数据在应用层面来说，往往可以取代传统意义上的抽样调查。大数据可以实时获取、往往混合了来自多个数据源的多维度信息，大数据的价值在于数据分析以及分析基础上的数据挖掘和智能决策。人工智能的发展离不开海量数据进行训练，究其根本，正是有了大数据的无数次训练和深度学习，才有了人工+智能。

想要了解更多大数据和人工智能的知识，欢迎关注科多大数据。更多更新的行业资讯，我们与你分享。