clear;clc;
M0 = dlmread('data0901.txt');
%舍弃无用的数据
for j = 1 : 7
M(:,j) = M0(:,j + 1);
end
%挑选吸烟数据
k1 = 0;
for i = 1 : 1236
if M(i,7) == 1
k1 = k1 + 1;
y11(k1) = M(i,1);%吸烟新生儿体重
x11(k1) = M(i,2);%吸烟怀孕时间
end
end
%考虑到这些数据中有缺失的数据,剔除这些数据
k2 = 0;
for i = 1 : k1
if(x11(i) < 999) && (y11(i) < 999)
k2 = k2 + 1;
x12(k2) = x11(i);%或者有更好的替换的方法
y12(k2) = y11(i);
end
end
k2
%一阶线性回归分析
X1= [ones(k2,1), x12'];
[b1, bint1, r1, rint1, s1] = regress(y12', X1);
b1, bint1, s1%注意:这里s是stat的缩写其中包括四个统计量的值:决定系数、F统计量以及F统计量所对应的概率(如果p<alpha时H0被拒绝回归模型成立)
figure(1)
rcoplot(r1, rint1)%绘制残差及其置信区间的图形
%最小二乘法拟合数据
b = polyfit(x12, y12, 1);
x = 220 : 340;%描点数据集
y = polyval(b, x);%根据拟合出来的回归系数得到估计值
figure(2)
plot(x12, y12, '+', x, y, 'b');%最小二乘法拟合数据效果显示(散点图和拟合直线对比)
%剔除异常数据点:就是残差的置信区间中不含有0的数据点
k3 = 0;
for i = 1 : k2
if rint1(i,1) * rint1(i,2) < 0%挑选正常数据
k3 = k3 + 1;%正常数据下标加一
x13(k3) = x12(i);
y13(k3) = y12(i);
end
end
k3
%用剔除了异常数据的数据进行回归分析
X2 = [ones(k3,1), x13'];
[b2, bint2, r2, rint2, s2] = regress(y13', X2);
b2,bint2,s2
figure(3)
rcoplot(r2, rint2)
当然了,这个程序是基于姜启源老师教材中的程序,其中有一些地方做了改动,让整个程序在篇幅上更加简洁,同时也加上了很多基于个人理解的注释,希望能帮助大家理解线性回归分析吖!