我有一个项目,我必须获得每个单词的频率系统标准在
我已经拿到那部分了。第二部分是得到每个单词的行号,我觉得我已经得到了,但是我无法将行号添加到输出字符串中,而且我也无法找到一种方法来按字母顺序排序,如果单词的频率相同
这是我的代码:if __name__ == '__main__':
wordCount = defaultdict(list)
words = {}
for i, line in enumerate(sys.stdin.readlines()):
wordCount[line].append(i+1) #add the line number to each element in the line
for word in line.lower().split():
words[word] = words.get(word, 0) + 1
sortedList = sorted(words.items(), key=itemgetter(1), reverse=True)
for word, frequency in sortedList:
print("%d %s" % (frequency, word))," " #
如果我输入“Python is really cool”#第1行
“我真的在使用python”#第2行
输出应为:
^{pr2}$