逻辑回归(神经网络Sigmod激活函数，计量logit模型)

最新推荐文章于 2024-06-21 09:04:41 发布

最新推荐文章于 2024-06-21 09:04:41 发布

文章标签：逻辑回归神经网络

import pandas as pd
import numpy as np
from sklearn import metrics
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.family'] = 'SimHei'
import seaborn as sns

df = pd.read_csv("heart.csv")
X = df.drop(['target'],axis=1)
y = df.target.values
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=16)
logreg = LogisticRegression()
logreg.fit(X_train, y_train)
y_pred = logreg.predict(X_test)
cnf_matrix = metrics.confusion_matrix(y_test, y_pred)
class_names=[0,1] 
fig, ax = plt.subplots()
tick_marks = np.arange(len(class_names))
plt.xticks(tick_marks, class_names)
plt.yticks(tick_marks, class_names)
sns.heatmap(pd.DataFrame(cnf_matrix), annot=True, cmap="YlGnBu" ,fmt='g')
ax.xaxis.set_label_position("top")
plt.tight_layout()
plt.title('混淆矩阵', y=1.1)
plt.ylabel('真实标签')
plt.xlabel('预测标签')

#进一步分析其指标
target_names = ['without heart disease ', 'heart disease']
print(classification_report(y_test, y_pred, target_names=target_names))

y_pred_proba = logreg.predict_proba(X_test)[::,1]
fpr, tpr, _ = metrics.roc_curve(y_test,  y_pred_proba)
auc = metrics.roc_auc_score(y_test, y_pred_proba)
plt.plot(fpr,tpr,label="data, auc="+str(auc))
plt.legend(loc=4)
plt.show()

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归(神经网络Sigmod激活函数，计量logit模型)

逻辑回归、激活函数、计量经济学ROC曲线表示真阳性与假阳性关系图，AUC取值在0~1之间,这里为0.9，综合说明模型泛化性能还是比较好的
复制链接

扫一扫

逻辑回归(神经网络Sigmod激活函数，计量logit模型)

逻辑回归(Logistic Regression)

逻辑回归推导如下

Sigmod激活函数与逻辑回归

Sigmod函数表示的S型曲线的总称，在神经网络里实际可以看成为逻辑回归，将变量映射到0-1之间，Sigmod函数作用是将是将输入的数据通过非线性映射，使得神经网络逼近任何非线性函数。

逻辑回归损失函数（极大似然估计，交叉熵）

交叉熵，根据交叉熵的公式，P，Q代表时观察和预测两个标签集合，交叉熵反映的是宏观两个集合的接近程度，通过不断将所有样本点交叉熵取均值

这里发现极大似然函数估计与交叉熵构造的损失函数式一样的，不同学科之间很多方法时相通的，可能只是表述不一样

机器学习逻辑回归与计量经济学logit模型

逻辑回归优点 1.不需要太多的计算资源，易于实现 2.因为输出的概率，通常不需要对特征进行标准化处理

逻辑回归缺点 1.无法处理大量的特征变量，容易过拟合 2.对于特征与目标变量不相关或者特征之间高度相似，逻辑回归效果不是很好

采用数据集为心脏病数据集，数据本身经过已经处理过，直接上模型，超参数为默认（因为模型训练结果还可以，不再进一步结合网格搜索进行调参处理）

模型准确率80%，recall等各指标表现还可以，进一步通过ROC曲线表示真阳性与假阳性关系图

ROC曲线表示真阳性与假阳性关系图，AUC取值在0~1之间,这里为0.9，综合说明模型泛化性能还是比较好的

“相关推荐”对你有帮助么？