numpy
删除行:
data = np.delete(data, [1,2,3], axis=0)
删除123行数据
删除列:
data = np.delete(data, -1, axis=1)
删除最后一列数据
选取最大n个值的索引
a = np.argsort(data)
选取一个最大索引
a = np.argmax(data)
pandas
连接行:
data = pd.concat([a, b], axis=0)
注意index重复问题
data = data.reset_index(drop=True)
连接列:
data = pd.concat([a, b], axis=1)
参数需为DataFrame
读文件
data = pd.read_csv(path, sep='\t') #读tsv文件
data = pd.read_csv(path) #读csv文件
矩阵相关系数
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.concat([data, label], axis=1)
corrmat = data.corr()
f, ax = plt.subplots(figsize=(12, 9))
sns.heatmap(corrmat, vmax=.8, square=True)