之前,我一直使用R语言实现随机森林等机器学习模型,在遇到报错情况时想和身边朋友交流,发现一个很尴尬的事情,擅长使用R的朋友不懂机器学习,而擅长机器学习的只用Python。所以,掌握Python来实现机器学习,是与同行顺畅交流的前提,现在开始总结用Python实现随机森林。
数据来源:波士顿房价数据boston
操作流程如下:
首先,载入boston数据,并取出数据矩阵X与响应变量y,
Boston = load_boston()
X = pd.DataFrame(Boston.data, columns = Boston.feature_names)
y = Boston.target
其次,随机抽取30%的数