我在向键添加值时尝试动态更新字典时遇到问题。在
下面的代码基本上是循环遍历子目录,然后遍历每个子目录中的文件。然后简单地解析每个文件,并将数据添加到defaultdict字典中。“位置”和“编辑比率”字段由两个值组成。我在这里要做的是适应那些最初不是从第一个文件中添加的键。请注意,密钥在每个文件中都是唯一的,但在其他文件中可能存在重复项。同样,也可能有出现在中的键,比如file7,它不在前6个文件中。我想在我的字典中通过在第一个键输入之前有6个占位符(0)来显示这一点。在dataDict = defaultdict(list)
for root, dirs, filenames in os.walk(rootdir + "/out/"):
for d in dirs:
print "Processing: ", d
colNames.append(d + "_" + sampOriginDict[d])
for editingFile in os.listdir(rootdir + "/out/" + d):
eFile = open(rootdir + "/out/" + d + "/" + editingFile, 'r')
for line in eFile:
# only care about 3 fields (chromosome, location and editratio)
chromosome, location, x1, x2, x3, x4, editRatio, x5, x6, x7 = line.split("\t")
chrLocation = chromosome + "_" + location
dataDict[chrLocation].append(editRatio)
下面显示了循环访问2个文件的简要输出:
^{pr2}$
到目前为止,代码还不能容纳占位符。因此,通过查看输出,我不确定“0.15”是来自第一个文件还是第二个文件。在
任何帮助都将不胜感激。谢谢你
编辑:我添加了一个条件来检查键是否已经存在,这是结果输出:chr17_37916827 ['File2']
chr16_29681751 ['File1']
chr6_150045787 ['File2']
chr10_75538108 ['File1', 'exists']
chr15_64447436 ['File1', 'exists']
chr16_15794023 ['File1', 'exists']
代码:if chrLocation in dataDict.keys():
dataDict[chrLocation].append("exists")
else:
dataDict[chrLocation].append(d)
我希望实现输出:chr17_37916827 ['0', 'File2']
chr16_29681751 ['File1', '0']
chr6_150045787 ['0', 'File2']
chr10_75538108 ['File1', 'exists']
chr15_64447436 ['File1', 'exists']
chr16_15794023 ['File1', 'exists']