预测分手概率|逻辑回归模型

最新推荐文章于 2025-05-20 19:46:55 发布

远方2.0

最新推荐文章于 2025-05-20 19:46:55 发布

阅读量901

点赞数 20

文章标签：逻辑回归算法机器学习

本文链接：https://blog.csdn.net/qq_56997043/article/details/144514551

版权

预测分手概率：逻辑回归模型的应用与实现

在现代数据科学中，逻辑回归(Logistic Regression) 是一种广泛应用的分类算法，其核心是通过特征变量预测事件发生的概率。今天，我们将探讨如何使用逻辑回归来预测情侣分手的概率。

一、逻辑回归的基本原理

逻辑回归是一种线性模型，尽管名字中包含“回归”，但它用于分类任务（例如分手/不分手）。其输出值是事件发生的概率，范围在0到1之间。

在这里插入图片描述

通过最大化似然函数，逻辑回归估计这些参数，从而实现对概率的预测。

二、预测分手的逻辑回归模型设计

1. 特征选择

预测情侣分手概率，需要选择能反映关系状态的关键特征，例如：

心理维度
- 关系满意度：评分范围1-10。
- 信任度：评分范围1-10。
- 矛盾次数：过去一个月的争吵次数。
行为维度
- 每周见面频率。
- 最近一次沟通时长。
环境维度
- 是否异地（是/否）。
- 工作压力指数（量化评分）。

2. 数据准备

假设我们有以下数据样本：

满意度	信任度	争吵次数	见面频率	是否异地	压力指数	分手 (标签)
7	8	2	3	否	4	0
5	6	5	1	是	7	1
9	9	1	5	否	3	0
3	4	8	0	是	9	1

数据的标签列“分手”是模型要预测的目标，取值为1（分手）或0（不分手）。

3. 模型训练

可以使用Python中的sklearn库构建逻辑回归模型。代码示例如下：

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, roc_auc_score

# 数据准备
data = {
    '满意度': [7, 5, 9, 3],
    '信任度': [8, 6, 9, 4],
    '争吵次数': [2, 5, 1, 8],
    '见面频率': [3, 1, 5, 0],
    '是否异地': [0, 1, 0, 1],
    '压力指数': [4, 7, 3, 9],
    '分手': [0, 1, 0, 1]
}
df = pd.DataFrame(data)

# 特征和标签划分
X = df[['满意度', '信任度', '争吵次数', '见面频率', '是否异地', '压力指数']]
y = df['分手']

# 训练集和测试集划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 模型训练
model = LogisticRegression()
model.fit(X_train, y_train)

# 模型预测
y_pred = model.predict(X_test)
y_pred_proba = model.predict_proba(X_test)[:, 1]  # 获取概率值

# 模型评估
accuracy = accuracy_score(y_test, y_pred)
roc_auc = roc_auc_score(y_test, y_pred_proba)
print(f'模型准确率: {accuracy}')
print(f'ROC-AUC分数: {roc_auc}')