1、 人类语言的语法知识。
不同的人类语言有不同的语言表达形式,包括语言符号,语言符号的组合和应用规则。阿拉伯文字、斯拉夫文字、罗马文字、拉丁文字、象形文字等代表着不同语言背景、语言文化。
2、 机器可用的词典知识库有哪些?
1) 类别词库。特定实体词、功能词、非功能词。
2) 组合词库。组合词库包括搭配词库,共现词库。
a) 搭配词库:
i. 位置共现:窗口共现、互信息、卡方
ii. 句法共现:成份共现(VP/NP)、依存共现(SBV,VOB,ATT,POB等)
iii. 语义共现:语义角色共现(工具,结果,趋向)
iv. 概念共现:同义词标准化、上位词、反义词等替换标准化
3) 替换词库。同义词库,兄弟节点词库,父亲节点词库,儿子节点词库
3、 语言模板的自我习得?
借助句子非主要成分移除,成份位置规则。
1) 手工枚举下的语言模板
2) 基于事实实例自举方式的语言模板生成
3) 基于类型符号替换的语言模板生成
4、 推理规则的自我习得?
1) 基于关系事实的推理规则反推
2) 基于类概念的推理规则生成
3) 基于类属性或描述的推理规则生成
5、 语料的自我扩充?
语料的自我扩充分成两个,一个是从无到有,另一个是从少到多。
1) 基于回标