回归方法(三)logistic regression(数据集Titanic)

这篇博客介绍了逻辑斯蒂回归模型,它是一种分类模型,用于估计条件概率分布P(YX)。通过逻辑斯蒂函数将线性函数转换为概率,适用于如Titanic数据集的生存预测问题。与线性回归对比,逻辑回归的因变量服从伯努利分布,且误差项非正态。应用包括人力资源分析、足彩预测和银行风控。使用R的glm()函数进行案例分析,预测精度达到0.809。
摘要由CSDN通过智能技术生成

1logistic 分布:设X是连续随机变量,X服从logistic分布是指X具有以下分布函数和密度函数:F(x)=P(X\leqslant x)=1/(1+e^{-(x-\mu )/\gamma })                       f(x)={F}'(x)=e^{(x-\mu)/\gamma }/\gamma (1+e^{(x-\mu )/\gamma })^2    

分布函数F(x)属于逻辑斯蒂函数,图形是一条S曲线,该曲线以点(\mu,1/2)为中心对称,曲线在中心点附近增长速度较快,在两端增长速度较慢,形状参数\gamma的值越小,曲线在中心附近增长越快。

二项逻辑斯蒂回归模型是一种分类模型ÿ

决策树(Decision Tree)是一种基于树状结构的机器学习算法,可用于解决二分类问题。在Titanic数据集中,我们可以使用决策树来预测乘客是否生还。 决策树通过逐步分割数据的特征,将数据分为不同的类别。为了构建决策树模型,我们需要选择一个合适的特征作为根节点,在Titanic数据集中,例如"性别"、"年龄"等特征可以作为根节点。根据不同特征的取值,递归地划分数据,并生成一个树状结构。最终我们可以使用这个决策树来对新的乘客进行生还预测。 神经网络(Neural Network)是一种模拟人脑神经元的计算模型,也可以用于二分类问题。在Titanic数据集中,我们可以通过训练神经网络来预测乘客是否生还。 神经网络由输入层、隐藏层和输出层组成。输入层接收Titanic数据集中的特征,隐藏层根据权重和激活函数进行计算,输出层产生二分类的预测结果。通过反向传播算法,我们可以调整网络中的权重和偏差,以最小化预测错误。 逻辑回归Logistic Regression)是用于解决二分类问题的广义线性回归模型。在Titanic数据集中,我们可以使用逻辑回归来预测乘客是否生还。 逻辑回归通过使用逻辑函数(也称为Sigmoid函数)将线性回归结果映射到0到1之间的概率值。对于Titanic数据集中的每个特征,我们可以使用逻辑回归建立一个模型,该模型可以根据乘客的特征值来预测其生还概率。 以上方法都可以用于解决Titanic数据集中的二分类问题。根据实际情况,我们可以根据特征的不同选择合适的算法,并根据模型的性能进行调整和优化,以提高预测的准确性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值