目录
1、startswith
使用情况:只知道某列的部分值,如何将全部包含这部分的数据提取出来;
可以考虑正则表达式,但是觉得那种比较麻烦;
想到了startswith('值'),查找以HLA开头的所有数据;
data = pd.read_csv('pan3.0/trainingdata.xls',sep='\t')
data = data[data['Allele'].str.startswith('HLA')]
data
2、contains
如果不是开头一样呢?可以考虑采用contains('值')
data = data[data['Peptide'].str.contains('EF')]
data