六、(2)随机森林——根据泰坦尼克号船员数据,预测其是否生还。
数据集下载地址https://pan.baidu.com/s/1g76H1913c5vYK1z02Ba_5w,密码 :yj1y ,保存为csv格式。根据自己想要测试的数据,选取目标值,另存为txt格式。下图是我整理的结果,抽取了社会等级、年龄、所住楼层、性别四个特征来预测是否生还。
代码如下:
# -*- coding: utf-8 -*-
"""
Created on Fri May 24 14:14:38 2019
@author: sun
"""
import numpy as np
from sklearn.ensemble import RandomForestClassifier
#划分数据集,设置最后一列为预测目标
def loadDataSet(file):
dataSet <