机器学习-*-聚类评价指标

最新推荐文章于 2024-03-20 03:23:45 发布

置顶

link-ai

最新推荐文章于 2024-03-20 03:23:45 发布

阅读量672

点赞数 1

分类专栏：机器学习 Python 文章标签：聚类评价指标

本文链接：https://blog.csdn.net/u013894072/article/details/89024254

版权

本文探讨了聚类分析中常用的评价指标，通过代码实现，引用了《文本聚类分析效果评价及文本表示研究》论文，帮助理解如何评估聚类算法的性能。

摘要由CSDN通过智能技术生成

直接上代码，参考论文《文本聚类分析效果评价及文本表示研究》

#!/usr/bin/python
# -*- coding:utf-8 -*-
"""
@Name cluster_metrics
@Description
    聚类评估方法
@Date 2019/4/4
"""
import sys
import math

def _find_dict_and_dataset(p_class = [],c_class = []):
    """
    把标注类簇p_class和聚类后的类簇c_class
    转化成{doc:"类标"}形式并得到全部数据集X
    示例输入：[["1","2"],["3","4"]],[["1","3"],["2","4"]]
    :param p_class:
    :param c_class:
    :return: X,p_map,c_map
    """
    X = []
    p_map = {
   }
    c_map = {
   }
    for pi in range(len(p_class)):
        for i in range(len(p_class[pi])):
            doc = p_class[pi][i]
            p_map[doc] = "P"+str(pi)
            X.append(doc)

    for ci in range(len(c_class)):
        for i in range(len(c_class[ci])):
            doc = c_class[ci][i]
            c_map[doc] = "C"+str(ci)
    return X,p_map,c_map

def TraditionalIndexRate(p_class = [],c_class = []):
    """
    输出传统统计指标,在文本聚类中运用不多
    示例输入：[["1","2"],["3","4"]],[["1","3"],["2","4"]]
    :param p_class:
    :param c_class:
    :return: R,J,FM,PA,NA,AA
    """
    if len(p_class) == 0 or len(c_class) ==

最低0.47元/天解锁文章

link-ai

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习-*-聚类评价指标

直接上代码，参考论文《文本聚类分析效果评价及文本表示研究》#!/usr/bin/python# -*- coding:utf-8 -*-"""@Name cluster_metrics@Description 聚类评估方法@Date 2019/4/4"""import sysimport mathdef _find_dict_and_dataset(p_class =...
复制链接

扫一扫

专栏目录