Python数据分析:应用一

应用场景:分析Elasticsearch 中的索引每天占用的存储量, 存储量单位为mb, 按照存储量降序排列

1.读取文件

import pandas as pd
import numpy as np
result = pd.read_table('./analysis.txt', sep='\s+')
result.head(10)

输出:
health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
green open taskmanager-20181202 7C6CUgPESu2Go35zottXXw 1 1 5829 0 1.3mb 703.6kb
green open accor-20181202 KPspuAYXRrGuZ70LQamVoQ 1 1 56188745 0 36.2gb 18.1gb

  1. 写处理函数:store_size 格式化成mb 为单位的
def gb_to_mb(store_size):
    if store_size.find("gb") > -1:
        return float(store_size[0:store_size.find("gb")])*1024
    elif store_size.find("mb") > -1:
        return float(store_size[0:store_size.find("mb")])
    else:
        return float(store_size[0:store_size.find("kb")])/1024
  1. 应用 2 中的函数
result['store_size_format'] = result['store.size'].map(gb_to_mb)

输出:
health status index uuid pri rep docs.count docs.deleted store.size pri.store.size store_size_format
green open taskmanager-20181202 7C6CUgPESu2Go35zottXXw 1 1 5829 0 1.3mb 703.6kb 1.3
green open accor-20181202 KPspuAYXRrGuZ70LQamVoQ 1 1 56188745 0 36.2gb 18.1gb 37068.8

  1. 将结果写入另外一个文件
result[['index', 'pri', 'rep', 'store_size_format']].sort_values(by='store_size_format', ascending=False).to_csv("./process_result.csv")

参考

Python 实战

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值