机器学习笔记03随机森林调参

# -*- coding: utf-8 -*-import osimport pandas as pdimport numpy as np# 读取数据os.chdir(r'F:\python_data_mining\train_modified')data = pd.read_csv('train_modified.csv')data = data.drop(['ID'], ax...
摘要由CSDN通过智能技术生成
# -*- coding: utf-8 -*-

import os
import pandas as pd
import numpy as np

# 读取数据
os.chdir(r'F:\python_data_mining\train_modified')
data = pd.read_csv('train_modified.csv')
data = data.drop(['ID'], axis=1).copy()
print('数据预览: \n{}'.format(data.head()))


# 确定目标变量y和自变量X
X = data.iloc[:, 1:]
y = data.iloc[:, 0]

# 目标变量的01样本分布
print('目标变量Disbursed的01样本分布: \n{}'.format(y.value_counts()))

# 划分训练集和测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=123)

# # 建立随机森林模型
from sklearn.ensemble import RandomForestClassifier
import sklearn.metrics as metrics
rfc = RandomForestClassifier(oob_score=True, random_state=123)
rfc.fit(X_train, y_train)
pred_test = rfc.predict(X_test)
proba_test = rfc.predict_proba(X_test)[:, 1]

# 计算RF模型的accuracy(准确率)/AUC_score(AUC值)/oob_score(袋外分数)
print('参数采用默认值:')
print('accuracy = {}'.format(metrics.accuracy_score(y_test, pred_test)))
print('AUC_score = {}'.format(metrics.roc_auc_score(y_test, proba_test)))
print('oob_score = {}'.format(rfc.oob_score_)) # oob_score袋外分数代表了一个模型拟合后的泛化能力
print('================
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值