创建并组织缺失数据
MATLAB 中缺失值的形式取决于数据类型。例如,数值数据类型(例如 double)使用 NaN(非数值)表示缺失值。
x = [NaN 1 2 3 4];
您也可以使用 missing 值表示缺失数值数据或其他类型的数据,例如 datetime、string 和 categorical。MATLAB 自动将 missing 值转换为数据的原生类型。
xDouble = [missing 1 2 3 4]
xDouble = 1×5
NaN 1 2 3 4
xDatetime = [missing datetime(2014,1:4,1)]
xDatetime = 1x5 datetime
NaT 01-Jan-2014 01-Feb-2014 01-Mar-2014 01-Apr-2014
xString = [missing "a" "b" "c" "d"]
xString = 1x5 string
"a" "b" "c" "d"
xCategorical = [missing categorical({'cat1' 'cat2' 'cat3' 'cat4'})]
xCategorical = 1x5 categorical
cat1 cat2 cat3 cat4
数据集可能包含要作为缺失数据处理的值,但这些值不是 MATLAB 中的标准 MATLAB 缺失值,例如 NaN。您可以使用 standardizeMissing 函数将这些值转换为该数据类型的标准缺失值。例如&#