世界需要一个统一的深度语义模型_intersystem 如何统一语义-CSDN博客

世界需要一个统一的深度语义模型
实现NLP的统一信息模型
—深度语义模型DSM
一、世界需要一个统一的深度语义模型近几年，主要由深度学习等技术推动，人工智能技术取得了巨大进步，语音识别、图像识别、机器翻译等领域的技术水平都有了显著提升。但在向更高级的人工智能迈进时仍然遇到了很多难题和瓶颈，其中一个非常核心的问题再次被提出来，那就是——世界一直缺乏一个统一的语义模型，这是AI领域最重要的自然语言处理方面缺乏实质性进展的根本原因。是时候认真思考并构建一个统一的深度语义模型了，这将为让计算机“表达人类语言的涵义”和“表达人类大脑的想法”奠定一个坚实的基础，成为人工智能实现下一轮重大提升的关键。
为什么实现一个统一的语义模型如此重要和迫切呢？我们从目前自然语言处理采取的技术和存在的问题进行分析。
众所周知，自然语言处理（NLP）非常难。其实先不要说全面的自然语言处理，仅仅是其中的一部分即自然语言的理解（NLU）就非常非常难！自然语言理解还仅仅只是让计算机听懂人类话语的意思，而自然语言处理则要在理解的基础上实现表述、翻译、对话、查询、运算、缩写、扩写、推理、思考、规划、决策、行动等等一系列的任务。目前，最基本的自然语言理解就没有从根本上得到解决，就更不用说其它方面的处理了。
为什么自然语言理解和处理如此困难呢？这要先问一个最基本的问题“自然语言理解的结果是什么？怎么才算正确的理解了一句话？”。对此简单的回答是：“自然语言理解就是计算机对自然语言文字进行处理，解析成出文字的内在涵义——也就是俗称的语义。”。但这个回答只是把问题变成了“语义又该如何定义呢？不同领域、不同专业、不同的人采用不同的语言在不同的场景下表达出来的各种各样的文字，进行理解后产生的具体语义结构，究竟应该是怎么一个样子？”。这时我们发现，这个最基本的问题根本并没有得到令人满意的解答。
先看一看，在缺乏这样一个基础模型的情况下， NLP相关的技术是如何处理的。
目前，对自然语言的理解都是针对局部业务场景采取针对性的简化解决方案。从技术层面来看，分词、句法分析、语义分析、语用分析、模板匹配、实体标记、情感分析、指代消解、省略消解…等技术概念和手段众多，但没有一项能彻底解决问题，甚至每一项子技术自身也无法做到完全可靠。从业务层面来看，目前的语义搜索、智能客服、智能助手、聊天机器人、机器翻译、舆情分析、内容推荐、文章缩写、文章编写…等各种业务也都针对特定应用设计专用的处理方法，采用非常简化的语义体系甚至直接在语言层进行处理，不但无法统一融合，实际结果也差强人意。
一个典型的例子是人机对话处理，目前的智能助手基本都是采用对文本形式的语言模板进行匹配来实现所谓的理解，对关键字或者短语模板匹配成功了就视为正确理解了语义，然后调用对这些模板预先配置好的回复句子（同样是自然语言的）进行回复或者转到预设的一段程序进行处理。显然这些语言形式的文字模板并不真正具有描述语义信息的能力，并没有真正实现对意思的深度理解，只是依赖配置文件或者硬编码来驱动。用户话语略有变动就会导致理解错误，更难以实现多轮对话来完成更为复杂的业务应用。
近两年的主要潮流是寄希望于深度学习技术，试图把自然语言相关的问题都归纳为“串对串、端到端”的处理方法。但结果是除了机器翻译有不错的进展外，别的方面并没有实质性突破。这是由深度学习本身的原理所决定的，它适用于解决语音识别、图像识别等方面的问题，但并不是解决自然语言处理的关键。机器翻译有所进展的原因是这个特定业务可以在一定程度上淡化对语义的理解而只在语言文字串层面做转换也能拟合出一定效果（因为翻译过程中，输入和输出的语义基本不变）。参考人脑的思维模式可以预见：即便是机器翻译的未来也终究要基于语义理解，不基于语义理解的机器翻译技术终究一定会遇到天花板和瓶颈，比如达到百分之六七十的综合准确率之后就注定将无法再提升。这是其丢弃“语义理解”这个根本而完全依赖概率统计原理进行拟合匹配的方法本质所决定的。未来，只有在基于深度语义理解的基础之上实现的机器翻译，才能真正接近百分之百的准确率。
显然，人类的思维模式绝不是一种简单的字符串拟合匹配。人类理解别人话语的意思、进行思考推理决策、并将自己的意思生成话语表达给别人，存在着深层次的思考，运用着一种相对统一的内在思想的表达和运算体系。从这点来看，进行语义分析的方法一定是符合人类思维模式的正确方向，只是目前语义表达的模型和语义分析的技术过于薄弱因而效果不佳。各种方法和模型包括传统的语法分析、语义分析、词嵌入模型、知识图谱等等，都存在着诸多的问题，例如：
1、语义体系缺乏深度和完备性
2、实现结构缺乏足够的灵活性
3、知识概念缺乏模糊性适应性
4、语义和语言混杂不清
5、语义和语言无法融合
6、缺乏自我描述的体系
7、缺乏完整的演算体系
8、 ……
因为存在这诸多问题，传统的这些技术满足不了实现深度自然语言理解的要求，更无法形成支撑起完整的自然语言处理的闭环，和理想的统一语义模型相距甚远。
而这个根本问题不彻底解决，自然语言理解和更高级的智能处理也就没有一个稳固的基础和可以围绕的核心，就像没有根的水上浮萍，处理起来非常随意、非常浅薄、技术碎片化、形不成完整体系，这就是自然语言理解“难”了几十年而得不到实质性突破的根本原因。
深入进行分析，上述各个具体问题并非不能克服。而既然人类能通过不同形式的自然语言进行高效而准确的信息沟通和表达，内在就一定蕴涵着共同遵循的语义信息表达规范和标准。因此可以判定：一个统一的语义模型不但是这个世界绝对需要的，而且理论上也是存在的！终归会被构建出来，只是时间的早晚而已。
要构建这样一个统一的语义模型，需要吸取众多已有方法的优点，摒弃上述这些问题和缺点，并在多个关键点上做出很多创新突破，才能得到理想的结果。
按照这个方向进行多年研究的结果，产生了一种创新的模型——深度语义模型，简称为DSM。它有望在这个重要方向上率先取得突破，成为自然语言处理和相关AI业务应用可以参考的统一信息模型，推动相关领域的发展。
二、如何构建一个统一的深度语义模型实现深度语义模型的工作量巨大，内容非常广泛，要详细解析需要一篇巨著，这里只能对一些要点进行简单的阐述：
1、以语义为核心，语义模型完全脱离自然语言
在深度语义模型体系里，语义模型才是本质和核心，语言只是语义的外在表现形式，语言存在的唯一意义就是为表达语义而服务。因此在研究语义模型时，需要从千变万化的语言形式的素材和表象中，概括归纳抽取其本质，并构建出一个“纯”的语义模型，这个最终的语义模型将不依赖于任何语言，而是能独立完备地描述各种知识和信息。这一点非常的重要。
2、语义模型能和任意自然语言相互转换
这个脱离自然语言形式的语义模型又需要能无缝映射到任意自然语言，同一个语义模型可以和各种自然语言——包括不同语种和同一语种的不同说话方式（包括方言等）进行灵活的转换。也就是说，一组相同的语义知识或信息可以转换生成为任意的一种自然语言形式进行表达，反过来，这些自然语言形式又可以理解转化为正确的语义知识和信息结构。简单的说“就是用语言来进行外在表达，而用语义进行内在表达、描述、存储、运算、思考…”。
这个语义模型并不是以前曾经提出的所谓“中间语言”。“中间语言”是仍然以语言概念体系为基础，没有跳出语言形式的束缚。而深度语义是真正的“本质结构”，完全以语义概念为核心，彻底剔除掉语言形式的“噪音”干扰，构建起完整、严谨的语义体系。然后再和语言形式进行匹配对接，可以彻底解决语义和语言的结合关系这个基础问题。
可能会提出的疑问是：“人类语言千变万化，如何能用一种结构去统一表达呢？”。实际上，这一点的难度其实并不是那么大，要点是必须把语义和语言信息分开，不要混淆在一起，该归语义的归语义，该归语言的归语言。语义体系完全成型后，语言模型表达起来也就简单了，用通用的结构设计就可以有效表达不同语言的共性。一些语言确实存在非常特殊的个性，但这些特性毕竟有限，进行针对性处理就可以。
3、语义模型要具有足够的深度和自描述性
以前也有很多语义的学说和模型，它们存在的最普遍问题是：不能形成完整的体系，缺乏深度不能自我描述和演算。而深度语义模型的重中之重就是要解决以前这些模型的弊端，构建起具有足够深度和足够的自描述能力的语义体系。
具体方法上，语义模型的构建采取自顶向下方法，形成一个形如金字塔的多层级知识和信息结构体系。
这其实是遵循了一个非常基本的道理——“人脑的知识体系是分层级的”。越高层的知识就越基础越重要，是理解和表达更低层知识的依据，而越高层的知识的数量其实是越有限的。越低层的知识的数量就越多甚至无限，但都可以用高层的知识来解释。
最顶层的概念和知识叫哲学层——这绝对不是故弄玄虚，人类思考问题的最基本的一些原则和思想，就是数量非常有限的一些哲学性概念，例如离散化、概念、空间、时间、数量、程度、关联、存在…等，深度语义模型构建的基础工作是对这些概念进行了长时间的深刻的思考和组织构建，这些最基本概念必须经得起严格的检验和推敲。第二层是核心层，是在哲学层基础上划分出的数百个核心概念，包括事物、事件、关系、规则、公式、集合、区间、范围、比较、序列、性质、事实、目标、条件、结果、过程、愿望、情感、动作、行为…等等。
深度语义模型对哲学层和核心层的描述定义，绝不仅仅停留是把这些概念名词简单罗列出来，并且要构建起了他们之间本质的、完备的、具有说服力的内在关系，这些关系足以支持它们之间的相互表达、相互解释，才能构建起对各种知识进行描述和运算的基础。
可以将深度语义的体系看着完整的一棵树，顶层的哲学概念是树根；核心概念是树干和一些主要枝干；基础概念是更细的枝干；而外围概念是树的大量的叶子。树干很粗，但只有一根并且对于树来说是最重要的。树叶虽然数目众多，但必须依附于树枝和树干。只要树干和树枝存在，树叶可以随时飘落也能随时生长，就像人脑只要记住了高层级知识，就可以用来随时学习新的低层级知识还可能随时忘却——下次遇到了再学。
知识图谱和大数据等技术的问题就是没有构建起树干和枝干等基本的知识体系——即使有一些构建也非常简陋和不完整，在这种基础并不稳固的情况下收集的大量具体化信息（对应于深度语义模型里的外围层信息）就只能实现简单的运算，而不能实现真正的深度理解和推理思考等智能化处理。一个知识图谱动辄号称数十亿条的知识量，非常庞大，在某些方面远远超出了人类的记忆力，但并未见到就产生了足够的智能来真正实现和人类进行几轮真正有意义的对话——因为缺乏足够的知识深度和完整性。
4、语义模型要足够完备
语义模型的表达能力要足够完备，既能实现对基本的事物概念和关系进行定义和描述，又要能对事件、动作、情感、意图等进行描述，还要能对因果推理等复杂体系进行描述。能描述短语，也能描述上百字的长句子以及段落、篇章、文章，还要能描述完整对话的整体过程，甚至要能对人脑的思维过程进行描述和表达。
深度语义模型在对自然语言的处理过程中，理论上对所有有效信息都不能丢弃，每一个字符的含义和作用原则上都需要能作出合理的解释。
相比较而言，目前的知识图谱等技术是很不完整的，很难完整表达哪怕是几十个字的短文的信息，一般只是针对不同场景设计专用的一些结构来存储和处理提取局部关注的信息，更像一个具有一定灵活表达能力的词典，而词典是不具备智能的。可以说：深度语义模型关注完整信息，知识图谱只提取片段信息。
另外，目前的知识谱图也很难实现和不同自然语言双向灵活的对接。
5、基于模糊逻辑，能容纳不确定性
一些基于规则的系统不能很好地解决实际问题的原因，一方面是知识和规则缺乏层级关系，另一方面就是知识、信息、规则的定义是二值逻辑，非黑即白，在灵活多变的环境下就总是遇到不能解决的“例外”。
深度语义模型采取模糊逻辑来解决这个问题，所有的知识、信息和规则的表达都体现为0～1之间的小数概率值，可以有效解决信息不确定性、歧义处理等难题。
在深度语义模型里，语义信息的处理就是一个不断具体化的过程，模糊逻辑同时体现在“意义性”和“正确性”两个方面。随着信息的增加，表达的语义的内涵增加而外延减少，使得描述的语义越来越准确和具体，因此“意义性”得到加分，而同时因为随着具体化的提升出现错误的概率就增大，因此“正确性”将减分，两者会达到一个平衡，最终的处理结果是综合打分最优的一个结果。
6、能描述计算、查询、推理等知识和演算体系
在实现对各种知识和信息深度描述的基础上，进一步实现对规则、计算、查询、推理等的描述，形成了对各种语义进行演算甚至模拟人脑思考的基础。
深度语义还容纳了基础数学知识的表达，对自然语言和语义中蕴涵的数学知识的分析和计算已能从根本上解决实现并且遵循相同的技术原理。
7、能灵活扩展，能表达各种行业领域的语义知识
深度语义模型具有足够的深度，最核心的哲学层和基础层足够抽象，具有很强的泛化表达能力，能灵活地向下和横向扩展来描述各种行业领域的语义知识。无论是常识知识，还是衣食住行、社会关系、情感交流、文化体育、自然科学、政治财经…，事实上只要适用于用语言文字表达的概念知识和思维处理，都可以用同一套深度语义模型进行描述和运算。
三、作为自然语言处理的信息表达基础在构建起来完整的深度语义模型后，就可以回答前述的有关自然语言理解后的结构究竟应该如何的根本问题——正确的理解结果应该按照深度语义模型所定义的语义结构作为标准。
同时，不仅是自然语言理解，完整的自然语言处理技术也都将以这个模型为依据，紧紧围绕语义结构为中心进行。语义和知识结构是严谨和明确的，作为最终的处理目标同时也是正确性的评判标准。在保证语义信息本身正确的目的下，语言可以进行做各种变形、简化、省略都不是问题，甚至出现一些噪音、语病、错误都能得到解决。
这样，自然语言的信息表达、理解和处理就具有了统一的根基和核心，向彻底解决相关技术难题迈出坚实的一步。
下边解释下深度语义模型体系下的语言和语义处理原理：
理解
在深度语义模型体系下，对自然语言进行深度语义理解后，将产生语义模型定义的完整语义结构，具体来说是一个语义网络结构，结构中的每一个节点都是和具体语言无关的语义概念，语义概念之间通过各种关联连接成为一个整体。
自然语言的传统算法，包括分词、句法分析、语义分析等分析，往往组织成一个串行的流水线作业步骤，后一个步骤的正确性完全依赖前一个步骤计算结果的正确性。如果在分词环节出现了5%的错误率，那么在后续的运算过程中间，其实无法去纠正这些错误还会逐级放大错误。
深度语义的理解处理，则是一体化的运算处理过程，对于上述的分词、句法分析、语义语言转换，语义分析等进行一体化的综合处理，并没有严格的先后次序，最终选择综合权衡打分最高的结果作为最终结果，这也是符合人类大脑解决问题的本质，最终能得到最理想的理解结果。
生成
在深度语义模型体系下，自然语言的生成则是理解的反向过程，也就是将要表达输出的语义结构生成一种自然语言的形式。
深度语义模型里的所有知识，甚至包括规则、推理等，都可以采用自然语言的方式进行表达和输出。
并且，计算机真正知道自己说出的话语是什么含义。不会象主流技术那样，只是从预先存储的自然语言 “知识库”中选择来直接输出，这种方式下，计算机看似也说出了话语，但对自己说出的话语的含义其实都茫然不知。
记忆
在深度语义模型体系下，记忆就是把深度语义模型的语义和语言信息结构进行存储，在需要时再进行加载调阅。
深度语义模型的信息在内存里的形式和在磁盘等永久存储的形式是一致的，存储和加载都非常简单。并且因为在纵向上具有层级划分和在横向上有领域划分，还可以根据按需加载。
原则上，深度语义存储的是语义结构，而不存储语言形式，在使用时根据需要再动态地将语义结构生成为具体的语言形式。
查询
在深度语义模型体系下，查询算法或者说搜索算法，也是围绕深度语义模型来进行的。是基于语义的模式匹配运算，而不是常规的基于文本关键字的搜索运算。匹配的结果首先完全是语义结构，根据需要再动态地将语义结构生成为具体的语言形式。
计算、推理、思考
如前所述，深度语义模型描述了各种运算的规则和知识，直接支持各种计算、推理、思考等认知处理。
这些高级演算处理仍然围绕同一个语义模型为中心，运算主要都在语义模型上完成，只是输入输出采用不同自然语言的形式。这种方法显然符合人类大脑思维的方式。
例如：首先用中文告诉计算机一些知识“这一年，王菲嫁给摇滚歌手窦唯…”，然后用英语询问计算机“Who is Douwei’s wife?”,计算机可以计算并回答“Wangfei is Douwei’s wife.”。
在深度语义模型体系支撑下，这些演算的能力可以由浅到深不断进化，最终将实现完全的自动复杂演算，逐渐摆脱用硬编码来解释和驱动各种智能业务的状态。
学习
在深度语义模型里，学习就是围绕同一个深度语义模型增加或者更新知识的过程，增加或者更新的知识都是相同的语义结构。
学习分多种方式，最核心的知识概念需要预先手工构建，而基础知识和外围知识就可以通过手工、半自动、全自动的方式来学习和构建，甚至实时学习、随用随学，支持以自然语言的形式和素材来直接学习。
深度学习和大数据等技术在语义信息表达上缺乏深度，所以不能独立解决自然语言处理的难题。但在构建好深度语义模型的基础上，则可以发挥深度学习和大数据等技术的特点，围绕深度语义模型进行大量外围知识的自动学习和收集。
其它处理
自然语言处理还有其它很多处理技术，例如情感分析、领域分析、信息提取等。在深度语义模型的体系里，它们都只是特定的一些语义信息维度，将在同一个体系中和别的运算结合在一起一体化处理。
实际上，人类大脑处理问题就是将所有这些理解、生成、记忆、计算、查询、推理、情感等各种各样的处理融合在一起综合处理的，这些信息和处理本身也会相互影响、相互描述、无法分开。试图把各个维度的信息或者处理分离出来单独处理，最终结果肯定是缘木求鱼，只有将它们融合在一起形成一个完整体系进行一体化处理，才能得到理想的结果。而要这样做，就必须围绕同一个深度语义模型为核心才能成为可能。
四、作为多种AI业务应用实现的统一基础在作为自然语言处理技术的统一信息表达基础的同时，深度语义模型也就成为了和自然语言处理相关的众多业务应用实现的统一基础。
在深度语义模型体系下，各种业务应用都围绕深度语义模型为核心，而具体运算处理都遵循三个环节：输入环节将输入的自然语言形式的信息或者请求理解成为语义结构；运算环节则是根据输入的语义结构结合语义知识库进行查询、变换、计算、推理等各种运算处理，形成新的语义结构；输出环节则将运算处理形成的新语义结构生成为自然语言形式进行输出。对于不同业务应用来说，输入和输出环节的处理基本相同，区别主要体现在中间的运算环节也就是对语义结构的变换处理有所不同。
对于机器翻译，中间的语义结构基本不做变换，只是输入和输出对应的自然语言语种不同。
对于问题查询、语义搜索，主要是对用户用自然语言表达的问题请求理解为语义结构后，到语义知识库中进行查询匹配，并对匹配结果进行整理后再生成自然语言输出。其中用户问题的语言、语义知识的原始语言、结果输入的语言三者可以是完全不同的语言。
对于人机对话的业务，中间的语义结构变换处理环节更为复杂，需要同时对查询、计算、推理甚至学习等同时应用，最终也是对中间处理环节最终产生的语义结构生成自然语言回复给用户。
而其它业务处理也都类似，这样，机器翻译、语义搜索、智能助手、智能客服、情报搜索、信息摘要、文章编写、专家系统…等各种自然语言相关的AI业务应用，都可以围绕同一个深度语义模型和相关的算法体系来进行。
这些不同的业务应用之间可以轻而易举地通过同一个语义模型和标准实现充分的信息互通和共享，还能将不同的业务应用融合形成全新形态的一体化业务应用。
更重要的是，既然这些不同业务应用的知识和信息采用相同的模型和标准，就可以汇总在一切形成统一的语义化知识和信息库，在更广的范围内解决各种知识和信息统一表达和共享：
互联网信息的统一语义表达
因为深度语义模型对于各种事物、关系、事件、动作等信息都采用统一标准的结构来进行表达、存储、交流和运算。可以将互联网上的各种文字信息进行深度语义化，对于一个人、一件商品、一次电商交易、一次旅行、一个观点、一篇新闻、一个广告…，都处理 “基于唯一语义内涵而可以体现为任意语言形式”的数据结构。每一个词汇都会理解为准确的概念，并和相关的概念进行关联，就象互联网的超链接一样，所不同的是，这种关联完全是基于语义进行动态生成并进行组织的，并不是直接指向一个网页，而是导向具体的语义对象。
物联网和客观信息的统一语义表达
自然语言其实是语义表达方式中的一种，对于客观世界里发生的各种事件，只要能够通过各种技术手段（声音、图像、视频、传感器等等）识别和采集到，就可以语义化并用深度语义模型进行统一表达、存储、处理，和其它信息处理手段结合形成对客观世界更详细的描述、表达、记忆和运算。可以让物联网设备和人、设备和设备之间的信息沟通更灵活、更智能。
“深度语义网”
各种知识和信息语义化后，汇总起来，最终可以形成物理分布而逻辑集中的统一语义化知识信息中心，以相同的深度语义模型存储和处理。这些知识和信息都可以被持不同语言的人类和计算机共同理解，构成一个“深度语义网”，为人类提供更智能化的信息服务。
总结：自然语言处理和认知智能的方向和目标，就是对自然语言蕴涵的本质的知识和信息进行统一化、标准化的完整理解和表达，并驱动各种认知智能的技术和应用。这个方向意义重大，难度也大，需要业界共同参与、持续努力来不断进步并实现最终目标，深度语义模型DSM在这个方向上已经奠定了非常重要的基础，必将在这个过程中发挥重要价值。