一种根据两两相关系数将多个对象进行分组，求解最优分组方案，并保证组内所有对象互相关的排列组合算法

最新推荐文章于 2023-01-19 12:04:48 发布

后知前觉

最新推荐文章于 2023-01-19 12:04:48 发布

阅读量1k

点赞数 1

分类专栏：算法文章标签：算法递归算法

本文链接：https://blog.csdn.net/h363924219/article/details/111687895

版权

项目场景：

接到一个电网项目，目标识别哪些电能表在一个表箱。
理论依据：同一表箱电能表电压变化规律相关，则计算所有表计之间的相关系数，将大于一定相关系数的电能表分为一组，且组内所有表计保证全部两两相关。

问题描述：

计算完所有表计之间相关系数之后，遇到一下几个问题：
1、同时存在相关关系的表计有很多，怎么进行分组，每组里面包含多少个对象怎么确定，有很多种可能，哪一种可能是最合理的。
2、从最大分组开始轮寻，采用逐个对象进行两两比对，计算量大，100多个表跑好几个小时，怎么解决性能问题。
3、通过排列组合方法寻找所有组合可能，100多个表直接分组会导致机器内存异常，需要先进行一定处理，勉强可以分组，耗性能。

逐一匹配代码：

def get_class(similarity_m,threshold):
    """
    similarity_array：相似度矩阵，带有行名和列名
    
    step1:获取输入数据的第0行数据
    step2:若第0行满足指定阈值的个数只有1个，则重新设置阈值，否则进行下一步
    step3:由step2的返回结果所形成的列名构成新的矩阵，判断该矩阵中是否所有数都满足阈值条件：
    若不满足：从中取出子矩阵，并降低阈值，重复上述步骤
    若满足：返回列名
    """
    similarity_row = similarity_m.iloc[0,:]
    names = np.array(list(similarity_row[similarity_row>=threshold].index))
    
    assert names.shape[0]>1,print("域值过大，请重新输入")
#     if names.shape[0]<=1:
#         print("域值过大，请重新输入")
#         return 0
    
    similarity_m_new = similarity_m.loc[name

最低0.47元/天解锁文章

后知前觉

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
2
评论
一种根据两两相关系数将多个对象进行分组，求解最优分组方案，并保证组内所有对象互相关的排列组合算法

项目场景：接到一个电网项目，目标识别哪些电能表在一个表箱。理论依据：同一表箱电能表电压变化规律相关（待验证），则计算所有表计之间的相关系数，将大于一定相关系数的电能表分为一组，且组内所有表计保证全部两两相关。问题描述：计算完所有表计之间相关系数之后，遇到一下几个问题：1、同时存在相关关系的表计有很多，怎么进行分组，每组里面包含多少个对象怎么确定，有很多种可能，哪一种可能是最合理的。2、从最大分组开始轮寻，采用逐个对象进行两两比对，计算量大，100多个表跑好几个小时，怎么解决性能问题。3、通过
复制链接

扫一扫