智源深度 | NLP 面临的三大真实挑战(含视频)

清华大学孙茂松教授在智源论坛中提出自然语言处理面临的三大挑战:形式化知识系统缺失、深层结构化语义分析不足、跨模态语言理解局限。学者们就此展开讨论,主张融合大数据、富知识、跨模态以推动技术发展,提出知识图谱、语义分析和跨模态理解的目标愿景,并探讨了知识表示、多模态信息利用等问题。
摘要由CSDN通过智能技术生成

自然语言处理一直被誉为人工智能皇冠上的明珠。

一方面,实现语言智能十分艰难。尽管机器人在电竞、围棋等方面频频超越人类,但目前的系统仍无法达到三、四岁孩童的语言和理解能力。

另一方面在于自然语言处理本身对实现智能的重要性。

清华大学教授、智源首席科学家孙茂松认为,自然语言处理是机器智能难以逾越的鸿沟,已经成为限制人工智能取得更多突破的瓶颈之一。

近期,在智源研究院成立两周年之际举办的“智源论坛2020”中,八位智源学者针对当前自然语言处理领域的发展提出思考和看法,从多学科的角度启发新一代自然语言处理技术,为解决当前面临的三大真实挑战,提出可借鉴观点。

整理:智源实习生 周寅张皓

校对:贾伟、罗丽

图一,从左到右依次是孙茂松、张家俊、何晓东、颜水成、宋森、万小军、赵鑫、刘知远

自然语言处理方向:孙茂松、张家俊、何晓冬、万小军、刘知远

机器学习方向:颜水成

认知神经基础方向:宋森

智能信息检索与挖掘:赵鑫

整个研讨分为两部分,首先由清华大学孙茂松教授做引导报告《自然语言处理面临的三大真实挑战》,随后八位学者围绕多个问题进行探讨。

1

NLP面临的三大真实挑战

图二,孙茂松

清华大学孙茂松教授在引导报告自然语言处理面临的三大真实挑战中阐述了对于自然语言处理发展前景的看法。指出自然语言处理在历史上有两大范式——理性主义、经验主义,经验主义从九十年代到现在分为多个方向,2018年到现在,是大规模预训练语言模型。”但大规模预训练模型并不能真正理解更有深度的问题,因此并不能一味追求大规模的趋势,而是应该多轨共同发展。孙茂松教授提出了当前亟待攻破的挑战,分别是:

挑战之一:形式化知识系统存在明显构成缺失。例如现有的知识图谱大而不强,虽然规模大,但是实体间关系浅,缺少关于动作的三元组、事件间的逻辑关系。称之为知识图谱“三缺其二”。

挑战之二:深层结构化语义分析存在明显性能不足。解决知识图“三缺其二”问题依赖于对语言进行深层次语义分析。近年来对语义的分析取得了长足的进步,但是对深层结构化语义分析“欲行却止”。

挑战之三:跨模态语言理解存在明显融通局限。目前对跨模态语言理解的研究方兴未艾,是新的重要研究前沿,但是跨模态关系因缺乏深层结构化语义分析和世界知识导致推理能力较弱,存在“形合意迷”的问题。

 

针对这三大挑战,孙茂松教授提出了与其对应的三个目标愿景:知识图谱从“三缺其二”到“三分归一”;深层结构化语义分析从“欲行却止”到“且行且进”;跨模态语言理解从“形合意迷”到“形合意合”。以跨模态、大数据、富知识“三足”,通过经验主义加理性主义的研究方法,迎接挑战。

 

论坛的讨论由此展开,每位嘉宾根据孙茂松教授提出的三个挑战及其愿景来谈自己的看法和观点。

2

论 | 富知识

 

图三,张家俊

来自中科院的研究员张家俊强调了大数据、富知识以及多模态对于实现自然语言处理的终极目的重要性


张家俊长期从事数据和知识的结合以及以文本为核心的多模态信息处理研究,对于数据和知识之间的关系,张家俊阐述了两个观点。


第一,现有的知识图谱仍然比较简陋。从某一个领域突破&#

  • 6
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值