随机森林参数说明RF(n_estimators=500, n_jobs=-1)
1、要构造一个随机森林模型,第一步是确定森林中树的数目,通过模型的 进行调节。n_estimators越大越好,但占用的内存与训练和预测的时间也会相应增长,且边际效益是递减的,所以要在可承受的内存/时间内选取尽可能大的n_estimators。而在sklearn中,n_estimators默认为10。
2、随机森林还有一个重要参数是n_jobs,决定了使用的CPU内核个数,使用更多的内核能使速度增快,而令n_jobs=-1可以调用所有内核。
模型评估之混淆矩阵(confusion_matrix)含义
准确率(Accuracy)
Python中文件的读取与写入以及read(),readline(),readlines()区别
f.read()直接读取整个文件
f.readlines()读取整个文件,然后把每一行放到一个列表里。
f.readline()一行一行的读取文件。
参考链接:https://blog.csdn.net/weixin_42168614/article/details/88292146?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.channel_param
将cross_validation改成model_selection