数据预处理-邻值插补法

转生成为星绘儿

已于 2024-03-31 17:13:00 修改

阅读量406

点赞数 4

分类专栏：数据预处理文章标签： excel matlab 算法

于 2024-03-31 15:58:16 首次发布

本文链接：https://blog.csdn.net/2201_75977169/article/details/137202123

版权

数据预处理专栏收录该内容

2 篇文章

订阅专栏

本文详细介绍了如何使用Python对Excel文件中的数据进行处理，特别是对小于100的值进行左相邻值插补，通过for循环实现数据合并和预处理，以提升数据分析的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

面向萌新以及初学者，注释详细，理解简单，对于熟练者可以打包略作修改即可使用。

本代码可以更换地址，一键运行！！！你的点赞就是对我最大支持。

首先从Excel文件中读取数据并将其存储在变量all_xls中。然后，通过循环将所有数据合并成一行，并在数据中找到小于100的值，用其左侧相邻值进行插值处理。处理完成后，将数据恢复为原始格式并存储在xls_end中。

目的是处理Excel文件中的数据，对小于100的值进行插值处理，以便更好地分析和理解数据。通过循环和条件语句，可以有效地处理大量数据并进行必要的数据清洗和预处理工作。

close all  %关闭所有窗口
clc
clear all  %清理所有已有数据
xls1=xlsread("C:\Users\kokomi\Desktop\测试集PA.xlsx");%放入你的文件数据
xls2=[];%也可以存入其他你需要集合的文件数据
all_xls=[xls1;xls2];%数据集合
[m,n]=size(all_xls);%判断行列数
%%建立空函数，为了做储存for循环的数据做准备
xls_1=[];
xls_2=[];
xls_end=[];
for a=1:m  %for循环用来遍历所有行，合成一行
    xls_4=all_xls(a,:);
    xls_1=[xls_1,xls_4];
    a=a+1;
end
%目的是进行处理，此处做的是不足100的数进行相邻值插补
for o=2:m*n %for循环用来遍历上面一行中的每列
    if xls_1(1,o)<100
       xls_1(1,o)=xls_1(1,o-1);%进行左相邻值插补，右邻也可以（将两个互换），注意修改循环次数。
    end
       o=o+1;
end
%数据处理完成，还原成原来的格式
for b=1:m
    xls_2=xls_1(1,n*(b-1)+1:n*b);
    xls_end=[xls_end;xls_2];
    b=b+1;
end
%最后的值储存在xls_end里