问题:
在使用tf-idf特征和logistic regression模型作文本分类(二分类)时,出现了下面的情况:
试过相同特征下的其他模型如Naive Bayes,但是效果一样:
又分别试了下word count特征,而不使用tf-idf,效果还是不行:
所以,log loss 到底什么范围才合理?log loss 特别大的话该如何解决?
解决:
1.为什么使用 log loss?log loss 和其他模型评估指标有什么区别?
针对分类问题的模型评估,可能有多种指标选择,比如混淆矩阵中的 Recall, Precision, F-Score 或者 Accuracy。
还有一种选择是使用 loss 指标,比如 log loss。
Log loss 和他们的区别是:
l