统计的一个小题目python实现

最近面试碰到的一个题目,业余时间用python实现的。

拿到数据,先用sort 命令排序,也可再进一步去重复

sort -k 1,2  data.txt |uniq  > data.new

 

 1 # -*- coding:utf-8 -*-
 2 
 3 #第一个字段是用户uid,第二个字段是商品tid,统计每个商品的用户购买数量
 4 import sys
 5 
 6 pre_tid=""
 7 pre_uid=""
 8 sum=0
 9 for line in sys.stdin:
10         fields = line.strip().split('\t') #注意这里要加上strip()去除"\n"
11         uid = fields[0]
12         tid = fields[1]
13         if tid!=pre_tid:
14                 if sum!=0: #读取第一行时,不要打印
15                         print pre_tid+"\t"+str(sum) #类别改变就把上一个类别输出
16                         pre_uid=""
17                 pre_tid = tid
18                 sum=1 #初始化计数器
19         else:
20                 if(uid==pre_uid): #如果有两条完全重复的数据不计入
21                         continue
22                 else:
23                         sum=sum+1
24                         pre_uid=uid
25 
26 print pre_tid+"\t"+str(sum)#打印最后一个类别

 



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值