什么是大数据?大数据时代,数据不再仅仅指数字或数字构成的,数据的范畴要大的多。包括:互联网上的任何内容,比如文字、图片以及视频;书籍中的文字内容;医院里包括医学影像在内的所有医学档案资料;公司里的设计图纸、设计文档等;科学研究中的各种观测数据以及历史研究成果;甚至我们人类活动本身,也可被看成一种特殊的数据,比如我们在微信朋友圈等社交网络的行为,浏览网络的记录,我们每天的出行轨迹、活动范围等。从以上数据来源的纷繁复杂性,大数据的“大”的特征是不言而喻的,但大数据的特征不仅仅是体量大,还需要具备多维度以及完备性的特点,才足以刻画出一个立体的事物。
什么是人工智能?学术界将人工智能分为传统人工智能方法和现代人工智能方法。那么传统人工智能方法是怎样的呢?其实简单地讲,传统人工智能的思路是,首先了解人类是如何产生智能的,然后让机器按照人的思路去做。这是对人工智能直觉认识,早期科学家也在这个方向上进行了很长时间的研究,到20世纪60年代末实在发展不下去了。
20世纪70年代,人类开始尝试机器智能的另外一条发展道路,即采用数据驱动和超级计算的方法。该方法首先被康内尔大学的教授贾里尼克用于研究语音识别,在贾里尼克之前,各个大学和研究所得专家们在这个问题上已经花了近20年的时间,主流的研究方法有两个特点:一是让计算机尽可能地模拟人的发音特点和听觉特征,二是利用人工智能的方法理解人所讲的完整语句。对于第一项研究,又被称为特征提取,大家提取特征的方式不一,好坏也不一。对于第二项研究,大家都采用了传统人工智能方法,基于语法规则和语义规则。但贾里尼克不是语言学专家,而是一位通信专家,在他看来,语音识别其实就是一个通信问题。
对端是信息源,将所要表达的观点组织成语言然后表达出来ÿ