python处理数据

1、数据排序,python有两种选择。原地排序,排序后的数据替换原来的数据,原来的顺序会丢失,对于列表,sort()方法提供原地排序;复制排序,返回原数据的有序副本,原数据的顺序依然保留,sorted()支持复制排序。

2、数据排序示例

#filename列表形式文件名
def deal_file(filename):
    datalist=[]
    try:
        for item_name in filename:
            #rb:读二进制模式
            with open(item_name,'r') as out_file:
                for item in out_file: #取出整个文件数据
                    print(item)
                    #.split(',')生成列表
                    #item.strip().split(',') 方法串联
                    datalist.extend(item.strip().split(',')) #extend列表合并
                #data=out_file.readline() #readline只能读取一行数据
                #print(data)           
    except IOError as err:
        print('file error:'+str(err))
    print(datalist)
    #统一时间格式
    new_data=[]
    for str_time in datalist:
        new_data.append(deal_time(str_time))
    
    print(new_data)
    #对数据列表排序(函数串联)
    print(sorted(new_data))
#处理时间函数(统一格式,将-或:替换成.):3:4->3.4;3-4->3.4
def deal_time(time_string):
    if '-' in time_string:
        splitter='-'
    elif ':' in time_string:
        splitter=':'
    else:
        splitter='.'
    (mins,secs)=time_string.split(splitter)
    #补位数
    if len(mins)<2:
        mins='0'+mins
    if len(secs)<2:
        secs='0'+secs
    return (mins+'.'+secs)

3、排序方法示例代码修改,简化统一时间格式调用(使用列表推导)

#filename列表形式文件名
def deal_file(filename):
    datalist=[]
    try:
        for item_name in filename:
            #rb:读二进制模式
            with open(item_name,'r') as out_file:
                for item in out_file: #取出整个文件数据
                    print(item)
                    #.split(',')生成列表
                    #item.strip().split(',') 方法串联
                    datalist.extend(item.strip().split(',')) #extend列表合并
                #data=out_file.readline() #readline只能读取一行数据
                #print(data)           
    except IOError as err:
        print('file error:'+str(err))
    print(datalist)
    #统一时间格式
    new_data=[deal_time(str_time) for str_time in datalist]
    print(new_data)
    #对数据列表排序(函数串联)
    print(sorted(new_data))
​

[sort()与sorted()方法默认升序排序,若想要进行降序排序,需要传入参数reverse=True]  

4、使用集合删除重复项,集合中的数据项是无序且不允许重复的。

datalist=[10.6,11,6,10.6,10]
distances=set(datalist)
print(distances)
>>>输出结果
{10, 10.6, 11, 6} #直接会去掉重复的10.6

此目录会不定期更新,喜欢我的文章希望和我一起成长的宝宝们,可以搜索并添加公众号TryTestwonderful ,或者扫描下方二维码添加公众号

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

半夏映浮光

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值