分类——KNN、朴素贝叶斯、决策树、SVM、集成

最新推荐文章于 2022-06-03 22:30:50 发布

zzzzzzzz56

最新推荐文章于 2022-06-03 22:30:50 发布

阅读量1.8k

点赞数

分类专栏：数据挖掘与机器学习

本文链接：https://blog.csdn.net/weixin_43677780/article/details/89217815

版权

本文深入探讨了五大常用的分类算法：K近邻（KNN）、朴素贝叶斯、决策树、支持向量机（SVM）以及集成学习方法，如随机森林和AdaBoost。每种算法的原理、优缺点及应用场景进行了详细阐述，帮助读者理解如何选择和应用这些算法进行有效的数据分类。

摘要由CSDN通过智能技术生成

import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler,StandardScaler
from sklearn.preprocessing import LabelEncoder,OneHotEncoder
from sklearn.preprocessing import Normalizer
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.decomposition import PCA
#添加graphviz环境变量
import os
#os.environ["Path"]+=os.pathsep+"F:\graphviz\bin"
os.environ["PATH"]+=os.pathsep+"F:/graphviz/bin"
import pydotplus
#sl:satisfaction_level——False表示MinMaxScaler归一化
#npr:number_project——False表示MinMaxScaler归一化,True表示StandardScaler标准化
#amh:average_monthly_hours——False表示MinMaxScaler归一化,True表示StandardScaler标准化
#tsc:time_spend_company——False表示MinMaxScaler归一化,True表示StandardScaler标准化
#wa:Work_accident——False表示MinMaxScaler归一化,True表示StandardScaler标准化
#pl5:promotion_last_5years——False表示MinMaxScaler归一化,True表示StandardScaler标准化
#dp:department——False:LabelEncoding,True:OneHotEncoding
#slr:salary——False:LabelEncoding,True:OneHotEncoding
#lower_d:是否降维——False：不降维，True降维
#ld_n:指定降为几维
def hr_preprocessing(sl=False,le=False,npr=False,amh=False,tsc=False,wa=False,pl5=False,dp=False,slr=False,lower_d=False,ld_n=1):
    df

最低0.47元/天解锁文章

zzzzzzzz56

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分类——KNN、朴素贝叶斯、决策树、SVM、集成

import pandas as pdimport numpy as npfrom sklearn.preprocessing import MinMaxScaler,StandardScalerfrom sklearn.preprocessing import LabelEncoder,OneHotEncoderfrom sklearn.preprocessing import Nor...
复制链接

扫一扫

专栏目录