pandas下-综合练习

端午节的淘宝粽子交易

(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。

df=pd.read_csv('F:\Datewheel资料\pandas组队学习\Pandas(下)综合练习数据集\端午粽子数据.csv')
df.head()

在这里插入图片描述

df.info()

在这里插入图片描述

#查看列名
df.columns()

在这里插入图片描述
注意列名中含有空格,后面处理的时候要特别注意。

#删除最后一列为缺失值的行
df_1=df.copy().dropna(axis=0,subset=['发货地址 ']) 
df_1

在这里插入图片描述

#求所有在杭州发货的商品单价均值
pd.to_numeric(df_1[df_1['发货地址 '].str.contains('杭州')][' 价格'],errors='coerce').mean()

在这里插入图片描述
(2)商品标题带有“嘉兴”但发货地却不在嘉兴的商品有多少条记录?

df_1[df_1['标题'].str.contains('嘉兴')][~df_1['发货地址 '].str.contains('嘉兴')].shape[0]

在这里插入图片描述
(3) 请按照分位数将价格分为“高、较高、中、较低、低” 5 个类别,再将类别结果插入到标题一列之后,最后对类别列进行降序排序。

# 找出不正常的数字
df_1.loc[~df_1[' 价格'].str.match(r'^\d+\.?\d+$')]

在这里插入图片描述

df_1[' 价格'].iloc[[538,4376]]=[45.9,45]
df_1[' 价格'] = df_1[' 价格'].astype('float')
df_1['类别'] = pd.qcut(df_1[' 价格'],[0,0.2,0.4,0.6,0.8,1.],labels=['低','较低','中','较高','高'])
df_2 = df_1.reindex(columns=['标题','价格类别',' 价格','付款人数','店铺','发货地址 ']).sort_values('价格类别',ascending=False)
df_2

在这里插入图片描述
(4) 付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失值进行合理估计并填充。

df_1[df_1['付款人数'].isnull()]

在这里插入图片描述
(5)请将数据后四列合并为如下格式的 Series:商品发货地为 ××,店铺为××,共计 ×× 人付款,单价为 ××。

df_3=df_1.astype(str)
 s= ('商品发货地为'+df_3['发货地址 ']+',店铺为'+df_3['店铺']+',共计'+df_3['付款人数']+',单价为'+df_3[' 价格']+'。')
 s

在这里插入图片描述

ps:综合练习题目题量太大了,也很难,自己基础不好做起来很吃力,慢慢来吧,加油!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值