1,https://blog.csdn.net/zouxy09/article/details/49105265 此链接是一个基于graph的标签传播(Label Propagation)算法的说明和代码,其中考虑到未知标签一旦很多,单核处理时间过长,因此采用多核的MPI并行处理进行了代码处理。
2,为使用MPI进行并行处理,首先
按照 https://blog.csdn.net/zouxy09/article/details/49031845 安装mpi4py,openmpi和Cpython等相关工具包。
step1:按照 4.2、安装openmpi(可选择较新版本);
step2:下载系统对应版本匹配可用的Cython包,安装后检验是否安装成功;
step3:下载新版本的mpi4py(旧版本不支持3.5以上的python),再按照“4.4、安装mpi4py”进行解压和安装;最后检验是否安装成功即可。
由于该参考文档年限久远,实际操作过程中会产生问题,可参考最新的pip install mpi4py方式直接安装其工具包和相关软件包。