MATLAB中ismissing函数用法

目录

语法

说明

示例

向量中的 NaN 值

包含多个数据类型的表

指定表中的缺失值指示符

提示

算法


        ismissing函数的功能是寻找缺失的值。

语法

TF = ismissing(A)
TF = ismissing(A,indicator)
TF = ismissing(___,'OutputFormat',format)

说明

        ​TF = ismissing(A) 返回一个逻辑数组,该数组指示输入数据的哪些元素包含缺失值。TF 的大小与 A 的大小相同。

缺失值的定义取决于 A 的数据类型:​

  • NaN - double、single、duration 和 calendarDuration

  • NaT — datetime

  • <missing> — string

  • <undefined> — categorical

  • {''} - 字符向量的 cell

如果 A 是表,则每个变量的数据类型定义该变量的缺失值。

        对于没有标准缺失值默认定义的数据类型,ismissing(A) 会返回一个与 A 大小相同的由逻辑值 0 (false) 组成的数组或表。

        ​TF = ismissing(A,indicator) 将 indicator 中的值视为缺失值指示符,而忽略上述语法中列出的所有默认指示符。indicator 可以是单个指示符,也可以是多个指示符。例如,如果 A 是 double 类型的数组,则 ismissing(A,[0,-99]) 会将 0 和 -99 视为缺失的 double 值,而不是将 NaN 视为缺失值。

        TF = ismissing(___,'OutputFormat',format) 为表或时间表输入数据指定上述任一语法的输出数据类型。

示例

向量中的 NaN 值

        创建一个包含 NaN 值的行向量 A,并确定这些值在 A 中的位置。

A = [3 NaN 5 6 7 NaN NaN 9];
TF = ismissing(A)

TF = 1x8 logical array

   0   1   0   0   0   1   1   0

包含多个数据类型的表

        创建一个包含不同数据类型的变量的表。

dblVar = [NaN; 2; 3; 4; 5; 6];
singleVar = single([1; NaN; 3; 4; 5; 6]);
cellstrVar = {'one'; 'two'; ''; 'four'; 'five'; 'six'};
categoryVar = categorical({'red'; 'orange'; 'yellow'; ''; 'blue'; 'indigo'});
dateVar = [datetime(2015,1:4,15) NaT datetime(2015,6,15)]';
stringVar = ["a"; "b"; "c"; "d"; "e"; missing];

A = table(dblVar,singleVar,cellstrVar,categoryVar,dateVar,stringVar)
A=6×6 table
    dblVar    singleVar    cellstrVar    categoryVar      dateVar      stringVar
    ______    _________    __________    ___________    ___________    _________

     NaN           1       {'one'   }    red            15-Jan-2015    "a"      
       2         NaN       {'two'   }    orange         15-Feb-2015    "b"      
       3           3       {0x0 char}    yellow         15-Mar-2015    "c"      
       4           4       {'four'  }    <undefined>    15-Apr-2015    "d"      
       5           5       {'five'  }    blue                   NaT    "e"      
       6           6       {'six'   }    indigo         15-Jun-2015    <missing>

找出具有缺失值的元素。

        ismissing 返回一个数组,对于 A 中具有缺失值的每个对应元素,该数组中对应的逻辑值均为 1。TF 的大小与 A 的大小相同。

TF = ismissing(A)
TF = 6x6 logical array

   1   0   0   0   0   0
   0   1   0   0   0   0
   0   0   1   0   0   0
   0   0   0   1   0   0
   0   0   0   0   1   0
   0   0   0   0   0   1

指定表中的缺失值指示符

        创建一个表,其中 'NA'、''-99、NaN 和 Inf 表示缺失值。然后,找出具有缺失值的元素。

dblVar = [NaN; 3; Inf; 7; 9];
int8Var = int8([1; 3; 5; 7; -99]);
cellstrVar = {'one'; 'three'; ''; 'NA'; 'nine'};
charVar = ['A'; 'C'; 'E'; ' '; 'I'];

A = table(dblVar,int8Var,cellstrVar,charVar)
A=5×4 table
    dblVar    int8Var    cellstrVar    charVar
    ______    _______    __________    _______

     NaN          1      {'one'   }       A   
       3          3      {'three' }       C   
     Inf          5      {0x0 char}       E   
       7          7      {'NA'    }           
       9        -99      {'nine'  }       I   

        指定缺失值指示符。ismissing 返回一个数组,对于 A 中具有缺失值的每个元素,该数组中对应的逻辑值均为 1。

id = {'NA' '' -99 NaN Inf};
TF = ismissing(A,id)

TF = 5x4 logical array

   1   0   0   0
   0   0   0   0
   1   0   1   0
   0   0   1   1
   0   1   0   0

        ismissing 将忽略字符数组中的尾随空白。因此,在将空字符向量 '' 指定为缺失值指示符后,ismissing 会将 A.cellstrVar 中的空字符向量以及 A.charVar 中的空白均识别为缺失值。

参数说明

A-输入数据,指定为向量、矩阵、多维数组、字符向量元胞数组、表或时间表。

  • 如果 A 是时间表,则 ismissing 仅作用于表数据,而忽略行时间向量中的 NaT 和 NaN 值。

  • 如果 A 是元胞数组或包含元胞数组变量的表,则 ismissing 仅在元胞数组包含字符向量时检测缺失元素。

indicator-缺失值指示符,指定为标量、向量或元胞数组。

  • 如果 A 为数组,则 indicator 必须为向量。

  • 如果 A 为表或时间表,则 indicator 也可以是具有多个数据类型条目的元胞数组。

        indicator 的条目指示 ismissing 视为缺失并覆盖所有默认标准缺失指示符的值。如果您要添加指示符,同时保留标准指示符列表,则必须包含所有默认指示符作为 indicator 的元素。例如,如果 A 是包含 categorical 和数值的表,请使用 ismissing(A,{-99,'<undefined>'}) 指示 -99 为缺失的数值,但保留 <undefined> 为缺失的 categorical 值。

        也可以使用 missing 值作为表示为 NaN、NaT、missing 或 <undefined> 的任何缺失数据的指示符。如果 A 是一个表,则 missing 也是缺失字符向量元胞数组 ({''}) 的指示符。

        指示符的数据类型与 A 中条目的数据类型相匹配。下面列出了指示符与 A 的元素之间的其他数据类型匹配:

  • double 指示符匹配 A 中的 double、single、整数和 logical 条目。

  • string 和 char 指示符以及字符向量元胞数组形式的指示符匹配 A 中的 string 条目。

  • string 和 char 指示符匹配 A 中的 categorical 条目。

示例: TF = ismissing(A,0) 仅将 0 识别为缺失值。

format-输出数据类型,指定为下列值之一:

  • 'logical' - 对于表或时间表输入数据,以逻辑数组形式返回输出 TF。

  • 'tabular' - 对于表输入数据,以表形式返回输出 TF。对于时间表输入数据,以时间表形式返回输出 TF。

对于向量、矩阵或多维数组输入数据,不支持 OutputFormat。

示例:ismissing(T,'OutputFormat','tabular')

提示

  • 由于整数变量无法存储 NaN,请使用特殊整数值(或者未使用过的整数值)来指示缺失的整数数据,例如 -99。

  • 有关查找缺失字符串的详细信息,可以参考测试空字符串和缺失值。

  • 对于结构体数组或由非字符向量组成的元胞数组形式的输入数据,ismissing 返回 false。要查找结构体数组中的缺失值,请使用 structfun 函数将 ismissing 应用于结构体中的每个字段。要查找由非字符向量组成的元胞数组中的缺失值,请使用 cellfun 函数将 ismissing 应用于元胞数组中的每个元胞。

算法

        对于字符向量元胞数组、字符数组或分类数组形式的指示符,ismissing 以不同的方式处理前导和尾随空白。

  • 对于字符向量元胞数组,ismissing 不会忽略指示符空白。所有字符向量必须完全匹配。

  • 对于表变量中的字符数组,ismissing 会忽略指示符中的尾随空白。

  • 对于分类数组,ismissing 会忽略指示符中的前导和尾随空白。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值