1 现有的dataframe存储的是样本和样本间的权值(注意:是相似程度不是距离)
2 思路: 利用KNN算法得到dataframe每行前20个最大值
代码:
import pandas as pd
import numpy as np
df = pd.read_csv('PBMC3_wsnn.csv',header=0,index_col=0,sep=',') #样本与样本间的相似度
df_distance=1-df #得到样
1 现有的dataframe存储的是样本和样本间的权值(注意:是相似程度不是距离)
2 思路: 利用KNN算法得到dataframe每行前20个最大值
代码:
import pandas as pd
import numpy as np
df = pd.read_csv('PBMC3_wsnn.csv',header=0,index_col=0,sep=',') #样本与样本间的相似度
df_distance=1-df #得到样