python使用sklearn进行逻辑回归

文章演示了如何利用Python的sklearn库进行逻辑回归分析。首先导入必要的库,然后创建一个自定义的房屋租金和面积数据集,接着对数据进行标准化预处理,再用LogisticRegression拟合数据并训练模型,最后对新的房屋信息进行租赁预测并输出预测概率。
摘要由CSDN通过智能技术生成
在逻辑回归部分,使用的数据集为自定义的房屋租金和面积相关的数据集,在实验初始阶段会
进行定义。
步骤 1 导入依赖
输入:

 

# 从 sklearn.preprocessing 里导入 StandardScaler。
from sklearn.preprocessing import StandardScaler
# 从 sklearn.linear_model 里导入 LogisticRegression
from sklearn.linear_model import LogisticRegression
步骤 2 自定义数据集
输入:
# X:每一项表示租金和面积
# y:表示是否租赁该房间(0:不租,1:租)
X=[[2200,15],[2750,20],[5000,40],[4000,20],[3300,20],[2000,10],[2500,12],[12000,80],
 [2880,10],[2300,15],[1500,10],[3000,8],[2000,14],[2000,10],[2150,8],[3400,20],
 [5000,20],[4000,10],[3300,15],[2000,12],[2500,14],[10000,100],[3150,10],
 [2950,15],[1500,5],[3000,18],[8000,12],[2220,14],[6000,100],[3050,10]
 ]
y=[1,1,0,0,1,1,1,1,0,1,1,0,1,1,0,1,0,0,0,1,1,1,0,1,0,1,0,1,1,0]
步骤 3 数据预处理
标准化数据,保证每个维度的特征数据方差为 1 ,均值为 0 。使得预测结果不会被某些维度过
大的特征值而主导。
输入:
ss = StandardScaler()
X_train = ss.fit_transform(X)
查看标准化处理后的数据。
输入:
print(X_train)

输出:

步骤 4 数据拟合
输入:
#调用 Lr 中的 fit 模块训练模型参数
lr = LogisticRegression()
lr.fit(X_train, y)
步骤 5 数据预测
输入:
testX = [[2000,8]]
X_test = ss.transform(testX)
print("待预测的值:",X_test)
label = lr.predict(X_test)
print("predicted label = ", label)
#输出预测概率
prob = lr.predict_proba(X_test)
print("probability = ",prob)

输出:

 

 

可以使用sklearn中的逻辑回归模型来实现垃圾分类,具体步骤如下: 1. 数据预处理:将数据集划分为训练集和测试集,并进行特征提取和特征工程。 2. 构建模型:使用sklearn中的逻辑回归模型构建分类器。 3. 模型训练:使用训练集训练模型。 4. 模型评估:使用测试集对模型进行评估,并计算模型的准确率、精确率、召回率和F1值等指标。 下面是一个简单的示例代码: ```python # 导入库 from sklearn.feature_extraction.text import CountVectorizer from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score # 导入数据集并进行分割 data = # 自己准备数据集 X_train, X_test, y_train, y_test = train_test_split(data['text'], data['label'], random_state=0) # 特征提取和特征工程 vectorizer = CountVectorizer() X_train = vectorizer.fit_transform(X_train) X_test = vectorizer.transform(X_test) # 构建模型 clf = LogisticRegression() # 模型训练 clf.fit(X_train, y_train) # 模型评估 y_pred = clf.predict(X_test) print("Accuracy: ", accuracy_score(y_test, y_pred)) print("Precision: ", precision_score(y_test, y_pred)) print("Recall: ", recall_score(y_test, y_pred)) print("F1 Score: ", f1_score(y_test, y_pred)) ``` 在这个示例中,我们使用sklearn中的CountVectorizer进行特征提取和特征工程,并使用逻辑回归模型进行垃圾分类。最后,我们使用测试集对模型进行评估,并输出了准确率、精确率、召回率和F1值等指标。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值