Python小练习(二)
1、 原始数据,就是在练习(一)中的结果数据:
2、要求:
数据第二个字段都是在6点(0600)、13点(1300)、和20点的(2000)的,对这 3个时间段时间进行汇总
最后形成3个文件。
数据格式是这样的:
0600 19010101 -0128
0600 19010102 0128
3、代码:
str1='0600'
str2='1300'
str3='2000'
file_hadoop=open('/home/baolibin/bb.txt')
file_1=open('/home/baolibin/11.txt','w')
file_2=open('/home/baolibin/22.txt','w')
file_3=open('/home/baolibin/33.txt','w')
try:
line=file_hadoop.readline()
while line:
lines=line.split('\t')
print lines[1]
if lines[1] == str1:
file_1.writelines(lines[1]+'\t'+lines[0]+'\t'+lines[2])
elif lines[1] == str2:
file_2.writelines(lines[1]+'\t'+lines[0]+'\t'+lines[2])
else:
file_3.writelines(lines[1]+'\t'+lines[0]+'\t'+lines[2])
line=file_hadoop.readline()
finally:
file_hadoop.close()
file_1.close()
file_2.close()
file_3.close()
4、结果文件:
11.txt
22.txt
33.txt