【Numpy学习笔记3】数据清洗

1、数据清洗

常见数据异常

  1. 数据值缺失
  2. 数据值异常大或小
  3. 格式错误
  4. 非独立数据错误
import numpy as np

row_data = [
["Name", "StudentID", "Age", "AttendClass", "Score"],
["小明", 20131, 10, 1, 67],
["小花", 20132, 11, 1, 88],
["小菜", 20133, None, 1, "98"],
["小七", 20134, 8, 1, 110],
["花菜", 20134, 98, 0, None],
["刘欣", 20136, 12, 0, 12]
]
data = np.array(row_data) #list转换为array后,会跟一个dtype = xx
data

在这里插入图片描述

可以看到不同的 array 创建方式,可能会有不同的 dtype,而data.dtype=object,说明Python list 直接转换过来的 data 是无法参与诸多 Numpy 计算的。 而只有 dtypeint,float这样的数值形式,才能参与运算。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值