combinations
combinations(iterable, r) 创建一个迭代器,返回iterable中所有长度为r的子序列,返回的子序列中的项按输入iterable中的顺序排序
from itertools import combinations
list(combinations(range(3),repeat=1))
product
product(*iterables[, repeat]) 创建一个迭代器,生成表示iterables中的项目的笛卡尔积的元组,repeat表示重复生成序列的次数
from itertools import product
list(product(range(3),repeat=1))
groupby
以为只有pandas有groupby,没想到python自带groupby,两个的不同点在于自带版本只能聚合相邻相同key,pandas的聚合没有相邻这个限制
所以切记:乱序的文件输入之前,要先排序
# -*-coding:utf-8-*-
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import os
import re
from itertools import groupby
def group_pattern(line):
return line.strip().split("\t")[0]
def main():
groups = groupby(sys.stdin, group_pattern)
for key, values in groups:
value = list(values)
for sub in value:
fs = str(sub.strip()).split("\t")
...剩下操作就看自己了...