Python sklearn拆分训练集、测试集及预测导出评分决策树

最新推荐文章于 2022-12-12 10:41:17 发布

Silence19851125

最新推荐文章于 2022-12-12 10:41:17 发布

阅读量3.2k

点赞数

文章标签：数据结构与算法 python 人工智能

原文链接：http://www.cnblogs.com/lidada/p/11327677.html

版权

机器学习入门

　（注：无基础可快速入门，想提高准确率还得多下功夫，文中各名词不做过多解释）

Python语言、pandas包、sklearn包建议在Jupyter环境操作

操作步骤

1.pandas包加载给机器学习训练的表格

　　依照机器学习领域的习惯，我们把特征叫做X，目标叫做y，通常一列数据最后一列作为目标列

2.映射数据列为整型(Python做决策树需要整型或者实数)

3.拆分训练集、测试集

4.sklearn创建训练模型、测试模型准确率等

5.预测结果导出

算法

1.PCA算法
2.LDA算法
3.线性回归
4.逻辑回归
5.朴素贝叶斯
6.决策树
7.SVM
8.神经网络
9.KNN算法

import pandas as pd
import matplotlib.pyplot as plt 
X = pd.read_csv('x_train.csv')

X = X.drop('target', axis=1)
y = df.target

#

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注