![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
统计学
文章平均质量分 76
My_progress1
这个作者很懒,什么都没留下…
展开
-
模型分类及其性能度量
目录一.k值交叉验证二.精确率和召回率三.测试集的可视化四.P-R曲线五.参考文献一.k值交叉验证用途:验证模型的准确性与有效性过程:1.数据集被分成K份(K通常取5或者10)2.不重复地每次取其中一份做测试集,用其他K-1份做训练集训练,这样会得到K个评价模型3.将上述步骤2中的K次评价的性能均值作为最后评价结果优点:提高评估结果的稳定性这里的k=5二.精确率和召回率其通常做为二分类问题模型的评价指标三.测试集的可视化pricis原创 2021-11-24 15:49:47 · 662 阅读 · 0 评论 -
信息熵中的熵权法与文本分词的优化
一条信息中信息量的大小取决于什么?定义x是离散随机变量,其概率密度函数为p(x),它的信息熵(entropy)定义为信息熵是不确定性的标志,如果一个随机变量的信息熵越大,其不确定性也越高。可以在中文分词中运用到,...原创 2021-11-20 17:34:15 · 1277 阅读 · 2 评论