御神楽的学习记录之线性判别准则与线性分类编程实践

最新推荐文章于 2024-07-16 17:16:16 发布

YuKaguraNe

最新推荐文章于 2024-07-16 17:16:16 发布

阅读量133

点赞数 1

分类专栏：机器学习文章标签：分类 python 机器学习

本文链接：https://blog.csdn.net/YuKaguraNe/article/details/121168739

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

文章目录

前言
一、月亮数据集LDA算法
二、月亮数据集SVM分类
参考

前言

LDA（Linear Discriminant Analysis是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的。LDA在模式识别领域（比如人脸识别，舰艇识别等图形图像识别领域）中有非常广泛的应用。
SVM(Support Vector Machine) 指的是支持向量机，是常见的一种判别方法。在机器学习领域，是一个有监督的学习模型，通常用来进行模式识别、分类以及回归分析。

一、月亮数据集LDA算法

1.引入库及生成月亮数据集

引入库和生成100个数据点的月亮数据集

import matplotlib.pyplot as plt
from sklearn.datasets import make_moons
X, y = make_moons(n_samples=100, noise=0.15, random_state=42)

2.分类及结果

定义LDA分类函数

def plot_dataset(X, y, axes):
    plt.plot(X[:, 0][y==0], X[:, 1][y==0], "bs")
    plt.plot(X[:, 0][y==1], X[:, 1][y==1], "g^")
    plt.axis(axes)
    plt.grid(True, which='both')
    plt.xlabel(r"$x_1$", fontsize=20)
    plt.ylabel(r"$x_2$", fontsize=20, rotation=0)
    plt.title("MOONDATA",fontsize=20)

运行及结果

plot_dataset(X, y, [-1.5, 2.5, -1, 1.5])
plt.show()

在这里插入图片描述

3.总结

LDA是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的。我们要将数据在低维度上进行投影，投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离尽可能的大。

二、月亮数据集SVM分类

1.引入库及数据

库引入

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import make_moons
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.svm import LinearSVC
from sklearn.svm import SVC

生成月亮数据集：

X, y = make_moons(n_samples=100, noise=0.15, random_state=42)

2.数据分类函数

1、非线性SVM分类,当degree为0表示线性，大于0为多项式

def PolynomialSVC(degree,C=1.0):
    return Pipeline([
        ("poly",PolynomialFeatures(degree=degree)),#生成多项式
        ("std_scaler",StandardScaler()),#标准化
        ("linearSVC",LinearSVC(C=C))#最后生成svm
    ])

2、高斯核函数

def RBFKernelSVC(gamma=1.0):
    return Pipeline([
        ('std_scaler',StandardScaler()),
        ('svc',SVC(kernel='rbf',gamma=gamma))
    ])

3、绘制决策边界函数

def plot_decision_boundary(model, axis):
    x0, x1 = np.meshgrid(
        np.linspace(axis[0], axis[1], int((axis[1]-axis[0])*100)).reshape(-1,1),
        np.linspace(axis[2], axis[3], int((axis[3]-axis[2])*100)).reshape(-1,1)
    )
    X_new = np.c_[x0.ravel(), x1.ravel()]
    
    y_predict = model.predict(X_new)
    zz = y_predict.reshape(x0.shape)
    
    from matplotlib.colors import ListedColormap
    custom_cmap = ListedColormap(['#EF9A9A','#FFF59D','#90CAF9'])    
    plt.contourf(x0, x1, zz, linewidth=5, cmap=custom_cmap)

3.数据分类

1、线性核函数分类
惩罚系数C为1

poly_svc = PolynomialSVC(degree=1,C=1)
poly_svc.fit(X,y)
plot_decision_boundary(poly_svc,axis=[-1.5,2.5,-1.0,1.5])
plt.scatter(X[y==0,0],X[y==0,1]) 
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()

在这里插入图片描述
惩罚系数C为50

#线性处理,c=50
poly_svc = PolynomialSVC(degree=1,C=50)
poly_svc.fit(X,y)
plot_decision_boundary(poly_svc,axis=[-1.5,2.5,-1.0,1.5])
plt.scatter(X[y==0,0],X[y==0,1]) 
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()

在这里插入图片描述
可发现惩罚系数对线性分类无较大影响
2、多项式核函数分类
惩罚系数C为1

poly_kernel_svc = PolynomialSVC(degree=5,C=1)
poly_kernel_svc.fit(X,y)
plot_decision_boundary(poly_kernel_svc,axis=[-1.5,2.5,-1.0,1.5])
plt.scatter(X[y==0,0],X[y==0,1]) 
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()

在这里插入图片描述
惩罚系数C为50

poly_kernel_svc = PolynomialSVC(degree=5,C=50)
poly_kernel_svc.fit(X,y)
plot_decision_boundary(poly_kernel_svc,axis=[-1.5,2.5,-1.0,1.5])
plt.scatter(X[y==0,0],X[y==0,1]) 
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()

在这里插入图片描述
可发现惩罚系数对多项式分类影响较大
3、高斯核函数分类
高斯核处理参数为1

svc = RBFKernelSVC(1)
svc.fit(X,y)
plot_decision_boundary(svc,axis=[-1.5,2.5,-1.0,1.5])
plt.scatter(X[y==0,0],X[y==0,1]) 
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()

在这里插入图片描述
高斯核处理参数为50

svc = RBFKernelSVC(50)
svc.fit(X,y)
plot_decision_boundary(svc,axis=[-1.5,2.5,-1.0,1.5])
plt.scatter(X[y==0,0],X[y==0,1]) 
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()

在这里插入图片描述
高斯核处理参数为100

svc = RBFKernelSVC(100)
svc.fit(X,y)
plot_decision_boundary(svc,axis=[-1.5,2.5,-1.0,1.5])
plt.scatter(X[y==0,0],X[y==0,1]) 
plt.scatter(X[y==1,0],X[y==1,1])
plt.show()

在这里插入图片描述
发现高斯参数修改会影响分类，而且会出现过拟合现象

4.总结

⑴ SVM学习问题可以表示为凸优化问题，因此可以利用已知的有效算法发现目标函数的全局最小值。而其他分类方法(如基于规则的分类器和人工神经网络)都采用一种基于贪心学习的策略来搜索假设空间，这种方法一般只能获得局部最优解。

⑵SVM通过最大化决策边界的边缘来控制模型的能力。尽管如此，用户必须提供其他参数，如使用核函数类型和引入松弛变量等。

⑶通过对数据中每个分类属性引入一个哑变量，SVM可以应用于分类数据。

⑷SVM一般只能用在二类问题，对于多类问题效果不好。

参考

https://blog.csdn.net/lyr70334/article/details/106224064?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522163611034316780262529253%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=163611034316780262529253&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2_allfirst_rank_ecpm_v1~rank_v31_ecpm-5-106224064.pc_search_result_hbase_insert&utm_term=%E6%9C%88%E4%BA%AE%E6%95%B0%E6%8D%AE%E9%9B%86%E5%88%86%E7%B1%BB&spm=1018.2226.3001.4187
https://blog.csdn.net/qq_47281915/article/details/121169067?spm=1001.2014.3001.5501

YuKaguraNe

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
御神楽的学习记录之线性判别准则与线性分类编程实践

文章目录前言一、月亮数据集LDA算法1.引入库及生成月亮数据集2.分类及结果3.总结二、月亮数据集SVM分类1.引入库及数据2.数据分类函数3.数据分类4.总结参考前言LDA（Linear Discriminant Analysis是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的。LDA在模式识别领域（比如人脸识别，舰艇识别等图形图像识别领域）中有非常广泛的应用。SVM(Support Vector Machine) 指的是支持向量机，是常见的一种判别方法。在机器学习领域，是一.
复制链接

扫一扫