《python》学习笔记(Day3),数据处理:转换、清洗、排序

一、读入文本数据,存为列表。然后统一数据格式,升序排列输出到屏幕。

(1)

import os

import process
os.chdir('c:\\python27\\dataprocess')
with open('james.txt') as jaf:   #读入文本数据
    data=jaf.readline()              
james=data.strip().split(',')        #删除空格,以逗号为分割,存为列表
with open('julie.txt') as juf:
    data=juf.readline()
julie=data.strip().split(',')
with open('mikey.txt') as mif:
    data=mif.readline()
mikey=data.strip().split(',')
with open('sarah.txt') as saf:
    data=saf.readline()
sarah=data.strip().split(',')
clean_james=[process.sanitize(each_string) for each_string in james]           #统一数据格式,分钟和秒均以点号分割
clean_julie=[process.sanitize(each_string) for each_string in julie]
clean_sarah=[process.sanitize(each_string) for each_string in sarah]
clean_mikey=[process.sanitize(each_string) for each_string in mikey]
print sorted(clean_james)                                                                   #升序排列,输出到屏幕
print sorted(clean_julie)
print sorted(clean_mikey)

print sorted(clean_sarah)

(2)process模块为自编程序,包含函数sanitize,用于处理不一致的数据格式。

def sanitize(time_string):
    if '-' in time_string:
        splitter='-'
    elif ':' in time_string:
        splitter=':'
    else:
        return(time_string)
    (mins,secs)=time_string.split(splitter)
    return(mins+'.'+secs)

二、推导列表。

new_line=[funtion(t) for t in line]



评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值