目录
1.对于预测结果不理想,在logistics模型里加入平方项交互项等。
2.如果自变量有分类变量(如男女,行业有互联网行业、旅游行业……)
注意:代码文件仅供参考,一定不要直接用于自己的数模论文中
国赛对于论文的查重要求非常严格,代码雷同也算作抄袭
如何修改代码避免查重的方法:https://www.bilibili.com/video/av59423231 //清风数学建模
1.简介
根据已知大部分变量和结果,创建模型,对仅有变量的数据推断结果。像我之前写的RNN心脏病预测似的。
2.样例-二元
这里以根据因变量(质量、颜色等)判断水果种类(橘子苹果)。这种问题算0-1回归(最终结果只有是苹果和不是苹果 01处理)我们用logistics回归模型。
f1=@(x) normcdf(x); % 标准正态分布的累积分布函数
fplot(f1, [-4,4]); % 在-4到4上画出函数f1的图形
hold on; % 不关闭作图窗口
grid on; % 显示网格线
f2=@(x) exp(x)/(1+exp(x)); % Sigmoid函数
fplot(f2, [-4,4]); % 在-4到4上画出函数f2的图形
legend('标准正态分布的cdf','sigmoid函数','location','SouthEast')
以上生成个图说明?(好像对求解没大用)
进入SPSS后,点击分析-回归-二元logistics
当然这种直接生成准确率堪忧,可以对照已知数据和推测数据进行比较。因此要进行优化
1.对于预测结果不理想,在logistics模型里加入平方项交互项等。
转换-计算变量-选中后可处理
后续同上操作时,可以mass、m2都选。
2.如果自变量有分类变量(如男女,行业有互联网行业、旅游行业……)
转换-创建虚拟变量-然后删除任意一列以排除完全多重线性影响
3.分训练集、测试集
比较像深度学习了
4.fisher线性判别分析
分析-分类-判别式
分组变量(y):定义范围0-1(多个变量如4个可以1-4)统计勾选费希尔、未标准化,分类勾摘要表,保存勾第一个第三个
3.样例-多元
比如要判断苹果、橘子、柠檬、橙子,四种元,不再是非0即1了。
可以用上面的fisher线性判别分析,分组变量的定义范围就可以1-4了。
也可以用分析-回归-多元logistics分析