【数据处理与分析】电商订单数据清洗

任务详情:

请根据系统提供的订单数据表,按要求完成以下任务:

统计订单表格中,商品描述(choice_description)中为“NaN”的数量,并将其批量替换为“banana”,

请根据以上要求,将函数 nanCount() 补充完整,函数的返回值为整数值,既为“NaN”的数量。

任务要求:

1. 订单数据表为以逗号为分隔符的csv文件,编码方式为 UTF-8

2. 注意:DataFrame 由后台生成,作为参数 order_data 传递到 nonCount() 中,不需要生成新的 DataFrame;

3. DataFrame 读取为订单数据表;

3. 返回值为 NaN 的数量,int 数据类型。

重点:

1.选取到数据表columns为['choice_description']使用 isnull() 判断空值  是为True  不是为False

2.遍历得到的data数组 

3.if判断p==True count+1

4.最后使用fillna()把空值替换成 banana   

inplace: 是否在原对象基础上进行修改,默认为False

        inplace = True:不创建新的对象,直接对原始对象进行修改;

        inplace = False:对数据进行修改,创建并返回新的对象承载其修改结果。

  

代码如下:

class Solution:
    def nanCount(self, order_data:'DataFrame') -> int:
        # 从此处开始编写代码
        # 后台读取csv示例代码如下(参考)
        # order_data = pandas.read_csv(url, sep=',')
        data=order_data['choice_description'].isnull().values
        count=0
        for p in data:
            if p==True:
                count+=1
        order_data['choice_description'].fillna('banana',inplace=True)
        return count
        pass       

以上仅代表个人的思路,如有欠缺请指教。

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

红鼻子z

感谢打赏,我会继续努力的!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值