测试集
分为两种,英文测试集和中文测试集。由这两中语言的属性决定,英文测试集特别是权威的测试集数量相对较多且效果好,中文测试集数量少,有很多是论文作者自己手工构造的,测试结果的区别度不大。
英文测试集
使用广泛的Finkelstein 等人的WordSimilarity-353;Ken Lang的20 Newsgroup语料库;Miller和charles、Rubenstein和Goodenough、Finkelstein等[79]建立的相关度测试集。
中文测试集
Words-240、863 中文评测语料。
评价指标
比较有名的斯皮尔曼相关系数;rouge方法中的准确率P/召回率P/综合系数F1
待更新……