练习一、端午节淘宝粽子交易问题:
(1) 请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。
(2) 商品标题带有“嘉兴”,但发货地却不在嘉兴的商品有多少记录?(3)请按照分位数将价格分为“高、较高、中、较低、低”5个类别,再将类别结果插入到标题一列后,最后对类别列进行降序排序。
(4)付款人数一栏有缺失值吗?若有则请利用上一问的分类结果对这些缺失值进行合理估计并填充
(5)请将数据后四列合并为如下格式的Series:商品发货地为XX,店铺为XX,共计XX人付款,单价为XX。
(6)请将上一问中的结果恢复成原来的四列。 第一问:请删除最后一列为缺失值的行,并求所有在杭州发货的商品单价均值。
##删除发货地为缺失值的行
import pandas as pd
import numpy as np
df = pd.read_csv('data/table_damplings.csv',encoding='gbk')
#df.rename(columns={'标题':'name','价格':'price','付款人数':'number','店铺':'shop','发货地址':'address'},inplace=True)
df.columns=["name","price","number","shop","address"] df[df['address'].isna()].dropna(axis=0,how