如何使用python对.csv文件做louvain聚类

本文介绍如何利用Python对大型.csv文件进行Louvain聚类。首先导入所需包,然后读取文件并将相关系数矩阵转换为无向图的邻接表。由于数据集规模大,原始结果可能混乱,因此需要优化。最后,只输出特定类别中的细胞编号,聚类类别在代码中用红圈标注。
摘要由CSDN通过智能技术生成

针对之前得到的相关系数矩阵做louvain聚类
1.导入包
在这里插入图片描述
2.读取.csv文件,并把n*n的相关系数矩阵转化成无向图的邻接表形式
在这里插入图片描述
在这里插入图片描述

3.聚类
在这里插入图片描述
数据集很大,结果很乱,要改进

4.只输出需要的类中的细胞编号
在这里插入图片描述
红圈处是聚类的类别名称。

5.完整代码:

import numpy as np
import pandas as pd
import networkx as nx
import cylouvain
graph = nx.Graph()
csv = open("GSE52529_fpkm_matrix_ID_meanNorepeat_Peason.csv")
result = []
columns = csv.readline().st
  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值