tab separated
像这样的文件:
chr1 9507728 9517729 0 chr1 9507728 9517729 5S_rRNA
chr1 9537731 9544392 0 chr1 9537731 9547732 5S_rRNA
chr1 9497727 9507728 0 chr1 9497727 9507728 5S_rRNA
chr1 9517729 9527730 0 chr1 9517729 9527730 5S_rRNA
chr8 1118560 1118591 1 chr8 1112435 1122474 AK128400
chr8 1118591 1121351 0 chr8 1112435 1122474 AK128400
chr8 1121351 1121382 1 chr8 1112435 1122474 AK128400
chr8 1132513 1142552 0 chr8 1132513 1142552 AK128400
chr19 53436277 53446295 0 chr19 53436277 53446295 AK128361
chr19 53456313 53465410 0 chr19 53456313 53466331 AK128361
chr19 53465410 53465441 1 chr19 53456313 53466331 AK128361
chr19 53466331 53476349 0 chr19 53466331 53476349 AK128361
根据最后一列,有3个组,每个组有4行。根据第4列的值,我想得到每组第一行、每组第二行、每组第三行和每组第四行的平均值。因此,在预期的输出中,我将有4行(因为每个组有4行)和2列。第一列是ID,在本例中有1、2、3和4。第二列是我提到的应该如何计算的平均值。
expected output
:
1 0.33
2 0
3 0.66
4 0
我尝试在python 2.7中使用以下命令执行此操作:
file = open('myfile.txt', 'r')
average = []
for i in file:
ave = i[3]/3
average.append(ave)