中科院韩先培：预训练模型怎样成为下一代知识图谱

智源社区

于 2021-11-09 18:00:00 发布

阅读量1.6k

点赞数

文章标签：大数据编程语言机器学习人工智能深度学习

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/121240350

版权

本文探讨了预训练模型能否成为下一代知识图谱，指出模型虽具有知识预测能力，但存在提示语偏差、类别指导和答案泄漏等问题。研究强调，要深入理解模型内部机制并建立专业评估手段，才能将其发展为可信赖的知识图谱。

摘要由CSDN通过智能技术生成

【专栏：研究思路】随着大规模预训练模型的快速发展，许多研究者都在期待，模型能够将通用的知识抽取到通用的知识库/知识图谱中，为构建新的AI节省开发的时间和精力，让研究者能够更加专注于构建AI专门的能力上。

然而，超大规模预训练模型是否有成为下一代知识图谱的潜质？在近期的青源Talk活动中，中科院软件所韩先培研究员通过列举在预训练模型上开展的实验认为：预训练模型具有知识预测的能力，但是其仍存在很多缺陷，一是大规模预训练语言模型的工作机理还不明确；二是基于提示语的知识提炼手段，仍处于初步阶段，之前研究的一些评估手段都不可靠。

韩先培研究员建议，当前需要一些系统性的机制探索，彻底明晰预训练模型的内部机制。当可以解释这些模型的时候，就可以信任它，作为一个可信任的知识图谱。同时，建立专业和标准的评估手段，对模型提炼的知识进行专业效果评估也十分关键。