微信公众号:「Python读财」
如有问题或建议,请公众号留言
Pandas的style
用法在大多数教程中见的比较少,它主要是用来美化DataFrame
和Series
的输出,能够更加直观地显示数据结果。
下面采用某商店的零售数据集,通过实际的应用场景,来介绍一下style
中那些实用的方法。
首先导入相应的包和数据集
import pandas as pd
import numpy as np
data = data = pd.read_excel('./data/sales.xlsx')
data.head()
数据集中的特征有订单号、顾客姓名、商品名、数量、单价、金额以及对应的购买日期。
输出格式化
style
中的format
函数可以对输出进行格式化,比如在上述的数据集中,求每位顾客的消费平均金额和总金额,要求保留两位小数并显示相应的币种。
(data.groupby(['姓名'])['金额'].agg(['mean','sum'])
.head(5)
.style
.format('${0:,.2f}'))
又或求每位顾客的总消费金额(保留2位小数)及其对应的占比情况(以百分数形式展现)
consumer_sales = data.groupby('姓名')