机器学习入门
(注:无基础可快速入门,想提高准确率还得多下功夫,文中各名词不做过多解释)
Python语言、pandas包、sklearn包 建议在Jupyter环境操作
操作步骤
1.pandas包加载给机器学习训练的表格
依照机器学习领域的习惯,我们把特征叫做X,目标叫做y,通常一列数据最后一列作为目标列
2.映射数据列为整型(Python做决策树需要整型或者实数)
3.拆分训练集、测试集
4.sklearn创建训练模型、测试模型准确率等
5.预测结果导出
算法
1.PCA算法
2.LDA算法
3.线性回归
4.逻辑回归
5.朴素贝叶斯
6.决策树
7.SVM
8.神经网络
9.KNN算法
import pandas as pd import matplotlib.pyplot as plt X = pd.read_csv('x_train.csv') X = X.drop('target', axis=1) y = df.target #