AI-机器学习-自学笔记（三）逻辑回归算法

最新推荐文章于 2023-03-24 03:52:30 发布

阿尔法羊

最新推荐文章于 2023-03-24 03:52:30 发布

阅读量275

点赞数 3

分类专栏： AI自学笔记文章标签：逻辑回归算法机器学习

本文链接：https://blog.csdn.net/qq_41597915/article/details/120983986

版权

AI自学笔记专栏收录该内容

16 篇文章 21 订阅

订阅专栏

逻辑回归（Logistic）是二分类任务的首选方法。它输出一个 0 到 1 之间的离散二值结果。简单来说，它的结果不是 1 就是 0。所以逻辑回归解决的是分类问题，不是回归问题。它就是通过拟合一个逻辑函数（Logit Function ）来预测一个事件发生的概率所以它预测的是一个概率值。它的输出值应该为 0~1，因此非常适合处理二分类问题。

在 scikit-learn 中的实现类是 LogisticRegression 。

下面以一个Titanic数据集的例子来演示逻辑回归算法

import numpy as np
import pandas as pd
# 从sklearn导入LogisticRegression方法
from sklearn.linear_model import LogisticRegression
# 导入划分训练集和测试集的方法
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder


#读取数据
data = pd.read_csv("./data/titanic/train.csv") 
label = LabelEncoder()
#把一些文本数据转化成数值标签，比如性别应该是‘男、女’转成‘0、1’这样方便计算
data['sex'] = label.fit_transform(data['sex'])
data['class'] = label.fit_transform(data['class'])
data['alone'] = label.fit_transform(data['alone'])
data['embark_town'] = label.fit_transform(data['embark_town'])

features = ['class', 'age', 'n_siblings_spouses', 'parch', 'fare', 'sex', 'alone', 'embark_town','survived']
data = data[features]
print(data.head())

#划分训练集和测试集
X = data[['class', 'age', 'n_siblings_spouses', 'parch', 'fare', 'sex', 'alone', 'embark_town']]
y = data[['survived']]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=2)#random_state为随机种子，确保每次划分的结果是相同的

#调用逻辑回归的类进行运算
model = LogisticRegression(penalty='none')  # 请在此处修改 penalty 的参数值,只有l2 和 none两个值
model.fit(X_train,y_train)

# 测试模型
pred_y = model.predict(X_test)
# 输出判断预测是否与真实值相等，取前20个值看看
y_predict = model.predict(X_test[:20])
# 打印预测结果
print('===================预测值=======================')
print(y_predict)
# 打印真实值
print('===================真实值=======================')
print(np.array(y_test[:20]).tolist())
print('==================预测准确率======================')
Accuracy = accuracy_score(y_test[:20], y_predict)
print('模型预测的准确率为：{:.2f}%'.format(Accuracy*100))

打印结果如下

PS C:\coding\machinelearning>逻辑回归算法-Titanic.py
===================预测值=======================
[1 1 0 1 1 0 0 1 1 0 0 0 1 0 0 1 1 1 1 1]
===================真实值=======================
[[1], [0], [0], [1], [0], [0], [0], [1], [0], [0], [1], [1], [0], [0], [1], [1], [1], [0], [0], [1]]
==================预测准确率======================
模型预测的准确率为：55.00%
PS C:\coding\machinelearning>

阿尔法羊

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
AI-机器学习-自学笔记（三）逻辑回归算法

逻辑回归（Logistic）是二分类任务的首选方法。它输出一个 0 到 1 之间的离散二值结果。简单来说，它的结果不是 1 就是 0。所以逻辑回归解决的是分类问题，不是回归问题。它就是通过拟合一个逻辑函数（Logit Function ）来预测一个事件发生的概率所以它预测的是一个概率值。它的输出值应该为 0~1，因此非常适合处理二分类问题。在 scikit-learn 中的实现类是 LogisticRegression 。下面以一个Titanic数据集的例子来演示逻辑回归算法...
复制链接

扫一扫