# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
import lightgbm as lgb
from sklearn import metrics
from sklearn.cluster import KMeans
from sklearn.ensemble import RandomForestClassifier
from sklearn.feature_selection import VarianceThreshold, SelectKBest, chi2
from sklearn.metrics import f1_score, accuracy_score
from sklearn.model_selection import train_test_split, GridSearchCV
'''
数据读取
'''
data_Path = 'dataset/first_round_training_data.csv'
dataset = pd.read_csv(data_Path)
'''
数据预处理
'''
all_attrs = ['Parameter1', 'Parameter2', 'Parameter3', 'Parameter4', 'Parameter5', 'Parameter6', 'Parameter7',
'Parameter8', 'Parameter9', 'Parameter10', 'Attribute1', 'Attribute2', 'Attribute3', 'Attribute4',
'Attribute5', 'Attribute6', 'A
随机森林模型主要参数的调参方法
最新推荐文章于 2024-07-01 18:30:25 发布
本文详细探讨了随机森林模型的主要参数调参方法,包括森林中树的数量、节点划分的特征数、最小样本叶节点数等关键参数的影响,以及如何通过交叉验证和网格搜索来优化模型性能。
摘要由CSDN通过智能技术生成