一、基本思路
1.依据语义依存关系提取关键信息(修饰关系、疑问关系)
2.依照关键信息打分
3.计算分值,计算公式(待补充)
二、例子说明
1.例子1
句子:仲裁申请的资料需要哪些
语义依存关系:
关键信息提取:
仲裁==>资料(疑问)
句子:申请仲裁需要提供什么资料
语义依存关系:
关键信息提取:
仲裁==>资料(疑问)
2.例子2
句子:你的名字是啥?
语义依存关系:
关键信息提取:
你==>名字(疑问)
句子:你叫什么?
语义依存关系:
关键信息提取:
你==>名字(疑问)
句子:请问一下你的姓名是什么
语义依存关系:
关键信息提取:
你==>姓名(疑问)
句子:你的猫叫什么名字?
语义依存关系:
关键信息提取:
猫==>名字(疑问)
3.关键信息抽取信息规则
待补充
4.相似度评分标准
1.主语、宾语设为第1档
2.状语设为第2档(时间、地点、原因、介宾等)
3.谓语设为第3档
4.主语、宾语的修饰关系设为第4档
三、上下文的相似度
上下文关联:
例子:
1.什么是仲裁
关键信息提取:仲裁
2.申请仲裁需要提供哪些资料
关键信息提取:仲裁、资料(疑问)
若是问题变为:
问1:什么是仲裁?
答1:仲裁是xx
问2:需要提供哪些资料
简要过程:
“问2”抽取:资料(疑问)
查找关键信息时找到了“申请仲裁需要提供哪些资料”,但缺少“仲裁”
正好可以从“问1”中补齐关键信息
这样就能算出“需要提供哪些资料”与“申请仲裁需要提供哪些资料”的相似度非常高
四、说明
语义依存关系标注方法采用哈工大的语法依存关系,网址:http://www.ltp-cloud.com/intro/#dp_how
词义为哈工大的同义词林(扩展版)