利用pandas对womenclothing 的列进行处理与可视化

本文详细介绍了如何运用pandas库对womenclothing数据集进行预处理,包括数据清洗、列操作及数据分析。通过实例展示了如何筛选、合并和重塑数据,同时利用可视化工具对结果进行直观展示,帮助理解女性服装消费的模式和趋势。
摘要由CSDN通过智能技术生成
import pandas as pd
import matplotlib.pyplot as plt
from pylab import *

#设置显示行数和列数
pd.set_option('display.max_rows',25000)
pd.set_option('display.max_columns',30)

#data=pd.read_csv('wc.csv')
#查看数据基本情况
#print(data.describe())

#查看各列指标数据情况

data=pd.read_csv('wc.csv')

#对sku列做聚类分析
sku=data.sku.count()
#查看各sku的销售量
groupedsku=data.groupby('sku').sku.sum().sort_values(ascending=False)
def func(x):
    if x>100:
        return x
    else:
        None
        
#print(groupedsku)
#print(groupedsku.describe()) #查看sku销售量的总体情况(平均值,最大值,最小值等)
        
#print(groupedsku.count())
#print(groupedsku.sum())
#print(groupedsku.apply(func).dropna().sum()) #查看销量在100以上的sku的总销量
#print(groupedsku.apply(func).dropna().count())#查看销量在100以上的sku的个数

#print(groupedsku.apply(func).dropna().count()/groupedsku.count()) #查看销量在100以上的sku的个数在总sku中的占比

#print(groupedsku.apply(func).dropna().sum()/groupedsku.sum())
#查看销量在1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值