天天说视觉也腻了 好歹之前在某飞也说过自然语言处理相关 虽然只是业务部门 不专业勿怪啊~~ 

自然语言处理

与图像处理一样,自然语言也是一个信息编码与解码的过程。机器将输入的自然语言数据中结构、含义和效用的不确定性消除,转化为它能够识别、理解和执行的信息进行处理。语音作为传递信息最直接高效的方式,是人们彼此之间情感交流和思想传递的最主要途径。实现人机无障碍交互一直是科研工作者们追求的目标,在早期的传统人机交互中,基本都是基于硬件比如键盘和鼠标来进行的,相比于人类的语音交互显得不是很自然,而且效率较低,所以将人与人之间的语言推广到人与机器之间的智能语音交互一直以来都是一个备受关注同时也极具挑战性的研究课题。

      语音识别是指通过计算机实现从语音自动转换到相应文字的过程。在实际应用中,语音识别通常与自然语言理解、自然语言生成和语音合成的技术结合在一起,提供一个基于语音的自然流畅的人机交互平台。语音识别技术发展初期主要基于模式匹配的方法,随着计算机计算能力的提升与算法技术的演进,机器学习方法尤其是深度学习技术越来越多地应用到了本领域的研究中。[1]语音信号通过算法进行计算处理后转换为对应的文字信息,也包括通过语音识别和确认讲话者的身份等。语音信号是由发声系统产生的、承载语言内容的声波,数学上可以表示为随时间变化的一维连续模拟信号。

RNN及自然语言处理 相关_语音识别

 常见语音识别的流程

  理想状态下这种循环神经网络是单向的,即在一个时间序列中,网络当前时刻的状态只与之前的状态相关,而与之后的状态无关。在实际中,时间序列中的输出可能不仅受到历史状态的影响,也需要根据未来状态进行修正。通过RNN可以建立一个将连续的语音信号转换为分立的音素符号的神经网络。对应一段语音信号的时频谱由若干个不同时帧段的频谱矢量构成,这些矢量作为一个序列依次输入到RNN神经网络,最终得到所对应的音素符号出现的概率。

      这种方法同样存在一定的弊端,例如输入语音数据很难与输出的对应音素符号完全对齐,为了解决这个问题,科学家们采用了连接时序分类的算法。通过计算所有可能的路径,然后根据所得到的路径分布计算得到最有可能的分布,从而建立输入语音与输出音素的一组最佳映射使之在时间上对齐。[2]在RNN和CTC的算法基础上,科学家们又发明了RNN-T算法,RNN-T模型的声学模型将输入的语音信号转换为RNN网络的隐藏状态,可以用单向或双向的RNN实现;另外一个模块“语言模型”将上一个文字输出的标签作为输入预测下一个标签,也可以使用单向的RNN来构建。[3]随着语音识别技术的不断发展,越来越多的算法与机制可以被引入语音识别领域,不断地解决着实际的问题。

      在语音识别的基础上,词嵌入和语义理解进行了更深一步的研究与发展。自然语言处理的一个重要步骤是根据这些语言中不同词所代表的含义特征抽象出若干独立特征维度,将每个词由原先的高维空间的独热矢量通过编码转换到这个低纬度的特征空间,从而通过矢量运算操作提取关于结构和含义的知识。这种方法和过程也被称为词嵌入。通过这种方法,构建的词向量中可以通过相关的关系建立达到数学运算的目的。同时也可以对对自然语言进行结构分析和语义理解。

RNN及自然语言处理 相关_语音识别_02

 

词嵌入的实例

      作为实际融入日常生活中的应用之一,机器翻译也是基于神经网络发展而成的,例如常见的双语翻译,把一种语言翻译成为另一种语言,通常采用两个编码器:一个编码器把源语言经过一系列的神经网络的变换表示成一个高维的向量;一个解码器负责把这个高维向量再重新解码成目标语言。[4]

      除了针对于语言的输入进行翻译输出以外,针对语言输入进行回答也是一项不可忽视的应用。甚至普及范围更加广泛,通过机器问答的方式,这样的应用在未来更有可能成为许多领域中的关键,例如物联网、人机交互等等。现在的许多物联网技术在实际产品应用上都采取了语音交互的方式。例如市面上众多的智能音箱就是语音问答的例子之一,通过自然连续对话的语音助理对语言与语义进行识别,再做出相应的回答与物联设备的控制。

问题的分析

 人工智能科学技术在模仿和代替人类认知、学习、分析和预测等特殊领域取得巨大成就; 人们不禁产生这样的疑问:人工智能是否或者何时能够全面达到甚至超过人类智能?

      我们不难得出结论,按照目前人工智能的发展来看,人工智能将不会超过人类智能。因为与机器相比,人类智能的最大优势当属它的逻辑推理能力、想象力、创造力及其高效性。人脑功耗只有20多瓦,处理许多感知及认知任务的精度与拥有庞大内存、运算速度达到万亿次的超级电脑相比却毫不逊色。尽管机器智能很可能在不远的将来在棋牌类竞赛中全面超越人类,但现有的机器学习框架并不能模拟出人类的想象力和创造力。因此,在当前情况下,机器智能全面超越人类智能的预测是不会成为现实的。

      随着机器学习算法的不断发展与进步,计算机借助强大的存储与运算能力,学习人类几千年来发展与进化过程中所积累的完整知识的能力越来越强,借助完整知识库对复杂事务进行预测与判断的准确度将会全面超越人类。由此推断,在未来几十年里,不仅是那些简单重复性的体力劳动将会全面被机器取代,而且那些需要对复杂事务进行评估与判断的工作,如金融投资、企业管理、军事指挥等,也有可能被让位于机器智能。甚至大到整个国家,也可能会越来越依靠机器智能预测政治、经济、外交发展趋势,制定最优的政策方针及发展规划。[5]然而,当前的机器学习框架无法模拟人类的想象力及创造力,科学研究与发明创造仍将是人类的优势所在。

      不难预测,在未来人类社会的发展进程中,将有越来越多的人从事科学研究以及新产品的设计研发工作。社会对每个人的知识能力、智慧以及发明创造力的要求将会越来越高,不具备这些能力的人们将会无法找到满意的工作,逐渐成为处于社会底层的贫困阶层。了解并解决科技迅速发展所带来的社会挑战,仍然是人类需要面对的任务,而人工智能是无法替代人类解决这些问题的。

      人工智能和智能机器对人类未来将产生巨大影响:是“天堂”还是“地狱”,是“融合”还是“消亡”尚无明确定论。也许我们需要更完善的模型,也许我们的世界会经历一个极不稳定的发展时期?

      通过对于人工智能的进一步发展与研究,人工智能对于人类带来的影响有正面也有负面。展望未来,人工智能将在技术应用和配套基础设施两个层面进一步发展。但是,人工智能在提升企业生产效率以及改善人类生活品质的同时,也带来很大的负面影响,比如以算法战、深度伪造等滥用人工智能技术的行为,对人工智能行业的发展以及经济社会的带来了负面效果。为促进人工智能行业的良性发展,需要加强人工智能的治理体系建设,建立起人工智能行业发展的伦理和法律治理框架。如果发展不在法律的限制内,人工智能可能由于恶意发展而失控。

      通过法律条例的约束,将人工智能的发展限制在合法的范围之内,让人工智能最大程度上起到帮助人类的作用。可见,人工智能与人类的关系不应是一场“零和”游戏,而应该是共同发展互相进步的合作关系。人类将知识和智能赋予了机器,使得机器具有了更丰富的功能和更强大的性能,从而更好的服务于人类的需要。同时,智能的机器也成就了人类,给人类带来了前所未有的应用和价值。随着技术的不断发展,人工智能的相关应用已经融入人类生活的方方面面,如今“AI+”也已经成为未来各大行业发展的主流方向,可见人类与人工智能的和谐共处将会成为未来社会的新常态。

人工智能的应用领域                       

RNN及自然语言处理 相关_语音识别_03