题目:
python读文件统计次数和求和怎么写?
有一个文件文件内容如下:
A 1 22
A 1 44
A 2 33
B 1 22
B 3 44
B 4 55
C 1 11
C 4 22
.
文件中有三列第一列代表ID,第二列代表类型,第三列代表价格,类型和价格均不固定
我现在想统计
通过第一列和第二列分组求和的值和第一列、第二列分组后第三列的count值
例如
A 1 2 66
A 2 1 33
.
我知道可以用collection的count统计出A第二列代表1的有几个数2有几个
但是不知道怎么分组后求第三列的和
解答:
#!/usr/bin/env python
# coding: utf-8
import re
patt = re.compile(r"""
(?P\S+)
\s+
(?P\S+)
\s+
(?P\d+)
""", re.I|re.U|re.X)
context = """
A 1 22
A 1 44
A 2 33
B 1 22
B 3 44
B 4 55
C 1 11
C 4 22
"""
collects = {}
for m in filter(None, map(patt.match, context.splitlines())):
d = m.groupdict()
collects.setdefault((d["id"], d["category"]), []).append(int(d["number"]))
for (id, category) in sorted(collects):
print id, category, sum(collects[(id, category)])>python -u "baidu.py"
A 1 66
A 2 33
B 1 22
B 3 44
B 4 55
C 1 11
C 4 22
>Exit code:0 Time:0.065
再问: python 3写的? 我2.7的环境运行不了 还有如果是读文本,而且文本里面是以|分割怎么办?
再答: 是python2的版本; 将正则表达式中的\s调整一下即可适应|分隔符号;$ cat data.txt
A|1|22
A|1|44
A|2|33
B|1|22
B|3|44
B|4|55
C|1|11
C|4|22
$ python
Python 2.7.2+ (default, Jul 20 2012, 22:12:53)
[GCC 4.6.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> exit()
$ python reparser.py
A -- 1, count:2, summary:66
A -- 2, count:1, summary:33
B -- 1, count:1, summary:22
B -- 3, count:1, summary:44
B -- 4, count:1, summary:55
C -- 1, count:1, summary:11
C -- 4, count:1, summary:22
#!/usr/bin/env python
# coding: utf-8
import re
patt = re.compile(r"""
(?P\S+)
[\s\|]+
(?P\S+)
[\s\|]+
(?P\d+)
""", re.I|re.U|re.X)
collects = {}
with open("data.txt", 'rt') as handle:
for m in filter(None, map(patt.match, handle)):
d = m.groupdict()
collects.setdefault((d["id"], d["category"]), []).append(int(d["number"]))