python与医学统计_利用SPSS、R、python建立简单的神经网络

该数据集来自医咖会之前的一篇SPSS教程(SPSS实例教程:二分类Logistic回归)。某呼吸内科医生拟探讨吸烟与肺癌发生之间的关系,开展了一项成组设计的病例对照研究。选择该科室内肺癌患者为病例组,选择医院内其它科室的非肺癌患者为对照组。通过查阅病历、问卷调查的方式收集了病例组和对照组的以下信息:性别、年龄、BMI、COPD病史和是否吸烟。

现在的任务是把344例的数据集拆分为训练集和测试集,建立一个简单的神经网络模型,看看模型的训练效果怎么样。

表1. 肺癌危险因素分析研究的变量与赋值

表2. 部分原始数据

步骤如下

1.选择分析—神经网络—多层感知器

2.变量窗口:要预测的结局变量放在因变量窗口,其他的预测变量根据自身类型放在因子或协变量窗口。连续型变量进入网络时,如果做标准化预处理可能会使模型效果更好。

3.分区窗口:一般是训练样本占70%,检验样本30%。这里软件的翻译可能存在错误,训练、检验、坚持其实分别对应:训练集、验证集、测试集。训练集用于训练模型,找出最佳的权重和偏置。验证集用以确定模型超参数,选出最优模型。测试集仅用于对训练好的最优函数进行性能评估。本案例不存在外部验证集,不需要设置,检验集就等同于测试集。

4.神经网络结构设置:我们参照上一课,隐藏层设置1层,共3个神经单元。SPSS只能设置两个隐藏层。隐藏层激活函数选择S型(sigmoid),因为输出是二分类的结果,选择softmax函数会更好。怎么设置网络隐藏层并不固定,更多的需要经验和反复尝试。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值