(26)数据分析-异常值处理与检测

本文介绍了使用Python的pandas库进行数据描述性统计分析,包括describe()函数展示数据概况,info()检查数据完整性,以及如何利用numpy进行异常值检测。通过示例展示了基于标准差的离群点检测方法。
摘要由CSDN通过智能技术生成

内容:

·describe()

·info()

·异常值检测与处理

·numpy

·DataFrame

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

score = DataFrame(data={
    "name": ["fom", "gom", "hom", "jom", "kom", "lom"],
    "score": np.random.randint(0, 100, size=6),
    "address": np.random.randint(1000, 2000, size=6)
})
score_copy = DataFrame(data={
    "name": ["fom", "gom", "hom", "jom", "kom", "lom"],
    "score": np.random.randint(0, 100, size=6),
    "address": np.random.randint(1000, 2000, size=6)
})
score = pd.concat(objs=(score, score_copy), axis=1).drop(labels="name", axis=1)
score["name"] = ["fom", "gom", "hom", "jom", "kom", "lom"]
print(score)
print()

运行结果

【describe()】

describe()只对可运算的类型的列有效

使用这个函数,可以快速查看每一列的各项数值,便于找出异常值

count:多少个值

mean:平均值

std:标准差

min:最小值

max:最大值

"""describe()"""
# describe()只对可运算的类型的列有效
# count:多少个值
# mean:平均值
# std:标准差
# min:最小值
# max:最大值
print(score.describe())
print(score.describe().loc["count"])
print()

运行结果

 【info()】

columns列索引

Non-Null:有没有空值

Count:个数

Dtype:类型

"""info()"""
# columns列索引
# Non-Null:有没有空值
# Count:个数
# Dtype:类型
print(score.info())
print()

运行结果

 【异常值检测与处理】

异常值检测常用的界定方法,如果数据都是呈标准正态分布的,如果data>3|data.std()|;

离群点检测检测,数值型数据都可以通过离群点来检测;

(numpy)

"""numpy"""
some_num = np.abs(np.random.randn(1000))
right_num = 3 * some_num.std()
print(some_num[some_num > right_num])
print()

运行结果

 (DataFrame)

"""DataFrame"""
score = DataFrame(data={
    "chinese": np.random.randint(0, 100, size=6),
    "math": np.random.randint(0, 100, size=6),
    "english": np.random.randint(0, 100, size=6)},
    index=["fom", "gom", "hom", "jom", "kom", "lom"]
)
print(score)
right_num = score.std()
print(score[score < 3 * right_num])

运行结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

弦之森

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值