先做一个简简单单的数据缺失值查找,此处以一列为参考
%% 异常值及缺失值检测
[num,txt]=xlsread("数据文件的地址") %num为数据中的数字部分,txt为数据中的文本部分
index=1; %要检测数据所在列
sales=num(2:end,index); %提出所列数据,进行检测
rows=size(sales,1); %对数据的行数(大小)读取 方便后面计算缺失率
%缺失值检测
nanvalue=find(isnan(sales)); %isnan函数来查找数组中的NaN值,返回逻辑数组,看数据是否为缺失值,并返回缺失值的序数值
if isempty(nanvalue) %isempty函数用来检查一个数组or变量是否为空,为空则返回逻辑值true(结合if语句)
disp('没有缺失值')
else
rows_=size(nanvalue,1);%因为find函数返回的是所有符合值的序数,并排成一列,这里用rows即表示了缺失值数量
disp(['缺失值的个数为:',num2str(rows_),'缺失率为:',num2str(rows_/rows)])
end