机器学习入门小结

kaggle上面的机器学习入门课程总结

首先是最基础的机器学习模型

决策树

我们在底部做预测的点叫做叶子。叶子处的分割和值将由数据决定

首先读入DataFrame的数据

melbourne_data = pd.read_csv(melbourne_file_path) 

打印其列名

melbourne_data.columns

用dropna方法让NaN值视为不可用

melbourne_data.dropna(axis = 0)

取Price这一列作为输出的Y

y = melbourne_data.Price

选取特征,即输入X

melbourne_feature = ['Rooms', 'Bathroom', 'Landsize', 'Lattitude', 'Longtitude']

列表里的参数也是数据集里面的列名

X = melbourne_data[melbourne_feature ]

导入决策树模型

from sklearn.tree import DecisionTreeRegressor

将模型实例化

melbourne_model = DecisionTreeRegressor(random_state=1)

random_state指定一个数字可以得到一个确定性结果

调用模型的fit方法,拟合曲线

melbourne_model.fit(X,y)

验证生成的模型

计算MAE Mean Absolute Error 

导入误差计算函数

from sklearn.metrics import mean_absolute_error

预测价格

predicted_home_prices = melbourne_model.predict(X)

实际价格和预测价格在误差函数的大小

mean_absolute_error(y, predicted_home_prices)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值