数据集中空值替换成对应特征的平均值

最新推荐文章于 2022-07-22 17:16:12 发布

weixin_30949361

最新推荐文章于 2022-07-22 17:16:12 发布

阅读量1k

点赞数

文章标签： python

原文链接：http://www.cnblogs.com/zhhy236400/p/9996441.html

版权

如果数据集中缺失数据，将其替换成所属特征的平均值。
假如文件forTest.txt中以下数据集：

2,2,2,NaN,2
3,3,NaN,3,3
4,NaN,4,4,4

加载和替换函数：

from numpy import *
def replaceNanWithMean(filename):
    dataMat=loadDataSet(filename,',')
    numFeat=shape(dataMat)[1]
    for i in range(numFeat):
        meanVal=mean(dataMat[nonzero(~isnan(dataMat[:,i].A))[0],i])
        dataMat[nonzero(isnan(dataMat[:,i].A))[0],i]=meanVal
    return dataMat
def loadDataSet(filename,delim='\t'):
    f=open(filename)
    stringArr=[line.strip().split(delim) for line in f.readlines()]
    dataArr=[list(map(float,line)) for line in stringArr]
    return mat(dataArr)
dataMat=replaceNanWithMean('forTest.txt')
print(dataMat)

输出：

[[2.  2.  2.  3.5 2. ]
 [3.  3.  3.  3.  3. ]
 [4.  2.5 4.  4.  4. ]]

转载于:https://www.cnblogs.com/zhhy236400/p/9996441.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30949361

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
数据集中空值替换成对应特征的平均值

如果数据集中缺失数据，将其替换成所属特征的平均值。假如文件forTest.txt中以下数据集：2,2,2,NaN,23,3,NaN,3,34,NaN,4,4,4加载和替换函数：from numpy import *def replaceNanWithMean(filename): dataMat=loadDataSet(filename...
复制链接

扫一扫