1.困惑度是什么意思?
对于一个语言模型,一般用困惑度来衡量它的好坏。公式为一句话中每个词在这个位置上出现的概率分之1,然后累乘,再开N次方根,N是这句话的长度(或者分词后词的个数)。困惑度越低,说明语言模型面对一句话感到困惑的程度越低,语言模型就越好。
2.ROC曲线是什么意思?
该曲线的横坐标为假阳性率(False Positive Rate, FPR),也就等于1减去负类的召回率。纵坐标为真阳性率(True Positive Rate, TPR),也就等于正类的召回率。在ROC曲线中:对角线对应于随机猜想模型;点(0,1)对应于理想模型,没有预测错误,假阳性率恒等于0,真阳性率恒等于1;通常ROC曲线越靠近点(0,1)越好。