如何用Python处理NaN值
什么是NaN值?
NaN(Not a Number)表示无效数字,通常用于表示缺失值或计算结果不存在的情况。在Python中,NaN值通常以float类型出现。当数据中缺失某些值时,通常会使用NaN值来填充。
处理NaN值的方法
在Python中,处理NaN值的方法有很多,本文将介绍以下几种方法:
1. 用mean(均值)或median(中位数)填充缺失值
这种方法可以在一定程度上保持数据的分布特征,比如以均值填充,可以保持数据的平均值不变。针对一维的数据,同时存在NaN值以及非NaN值的情况下,可以先计算非NaN值的mean或median,然后将NaN值填充为这个mean或median值。代码示例:
import numpy as np
import pandas as pd
#创建一个数据
df = pd.DataFrame({
'A':[1,2,np.nan], 'B':[5,np.nan,np.nan], 'C':