在回归分析中,因变量可能又下面两种情形:
- y为一个定量的变量,这是用regress函数进行回归分析
- y是一个定性的变量,比如y=0或1,这时用Logistic回归分析。
Logistic方法主要应用于研究某些现象发生生的概率P,比如股票的涨跌,公司成功失败的概率,还有P的影响因素。
下面是企业还款能力评估来说明Logical。X1,X2,X3为三项评价指标,评价值0代表企业两年破产拒绝贷款,1代表具备还款能力可以贷款。
%% 数据准备
clear all
clc
X0=xlsread('Ch3_logistic_ex1.xlsx', 'A2:C21'); % 回归数据X值
XE=xlsread('Ch3_logistic_ex1.xlsx', 'A2:C26'); % 验证与预测数据
Y0=xlsread('Ch3_logistic_ex1.xlsx', 'D2:D21'); % 回归数据P值
%--------------------------------------------------------------------------
%% 数据转化和参数回归
n=size(Y0,1);
for i=1:n
if Y0(i)==0
Y1(i,1)=0.25;
else
Y1(i,1)=0.75;
end
end
X1=ones(size(X0,1),1); % 构建常数项系数
X=[X1, X0];
Y=log(Y1./(1-Y1));
b=regress(Y,X);%多元回归分析的命令regress,X是一个矩阵,其中第一列是全1向量(这一点对于回归来说很重要,这一个全1列向量对应回归方程的常数项)
%b是回归方程的系数
%--------------------------------------------------------------------------
%% 模型验证和应用
for i=1:size(XE,1)
Pai0=exp(b(1)+b(2)*XE(i,1)+b(3)*XE(i,2)+b(4)*XE(i,3))/(1+exp(b(1)+b(2)*XE(i,1)+b(3)*XE(i,2)+b(4)*XE(i,3)));
if Pai0<=0.5
P(i)=0;
else
P(i)=1;
end
end
%--------------------------------------------------------------------------
%% 显示结果
disp(['回归系数:' num2str(b')]);
disp(['评价结果:' num2str(P)]);
运行结果为
回归系数:-0.63656 0.004127 0.016292 0.53305
评价结果:0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1
将模型求解的结果与原始数据的评价结果进行对比,模型结果与实际结果完全一致,说明该模型准确率较高。