首先用把所有的数据读进来并转换成列表的形式(其中pd为pandas的简称,path为文件路径)。
读进来的数据格式为列表套列表。
比如说我们不想要数据列表中每个元素的第一和第二个(以莺尾花数据为例)。我们可以这样做:
def ignore_column(complete_data, column_list):
"""
因为每删除一个,列表就会变短一个,所以除了column_list第一个,我们都让column_list的元素减一
:param complete_data: 原始数据集
:param column_list:要删除的列的列表
:return:
"""
for i in range(len(complete_data)):
is_not_first = False
for j in column_list:
if is_not_first:
j = int(j) - 1
del complete_data[i][j]
is_not_first = True
return complete_data
删除第一列和第二列的结果如下: