监督学习

最新推荐文章于 2023-07-31 10:37:36 发布

所追寻的风

最新推荐文章于 2023-07-31 10:37:36 发布

阅读量135

点赞数

分类专栏： Machine Learning 文章标签： 1024程序员节

本文链接：https://blog.csdn.net/the_discovery/article/details/109266214

版权

Machine Learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1. 监督学习

1.1 广义线性模型

y是x的线性组合 $\hat{y}(w, x) = w_0 + w_1 x_p+...+w_p x_p$ 。求解y与x的回归问题。

定义向量 $w = (w_1, ..., w_p)$ 作为coef_

定义 $w_0$ 作为intercept_

1.1.1 普通最小二乘法

追求残差平方和最小。

在这里插入图片描述

from sklearn import linear_model
regression = linear_model.LinearRegression()
dataSet = [
    # 自变量
    [
        [0,0], [1,1],[2,2]
    ],
    # 因变量
    [
        0,1,2
    ],
]

regression.fit(dataSet[0], dataSet[1])
print(regression.predict(dataSet[0]))

console: [2.22044605e-16 1.00000000e+00 2.00000000e+00]

模型依赖于自变量各个维度的相互独立性。

如果实验数据设计不当，自变量数据容易出现多重共线性（multicollinearity）。

设自变量是维度为 $n_{features}$ ，样本数量为 $n_{samples}$ 。且 $n_{samples} \geq n_{features}$ ，
那么算法的复杂度为 $O(n_{samples} n_{fearures}^2)$ 。

1.1.2 岭回归

为了提高估计的稳定性，放弃最小二乘法的无偏性估计，而采用对权重的大小施加惩罚。

惩罚的力度α取得不同的值，权重的变化称为岭迹图。当权重的变化趋于稳定时，α的取值即为合理值。

在这里插入图片描述

from sklearn import linear_model
regression = linear_model.Ridge(alpha=0.5)
dataSet = [
    [
        [0,0], [0,0], [1,1]
    ],
    [
        0,0.1,1
    ]
]
regression.fit(dataSet[0],dataSet[1])
print(regression.predict(dataSet[0]))

console: [0.13636364 0.13636364 0.82727273]

时间复杂度同最小二乘法。

同时，我们也可以使用广义交叉验证来自动设置正则化参数：

regression = linear_model.RidgeCV(alphas=[0.1,1.0,10])
regression.fit(dataSet[0],dataSet[1])
print(regression.alpha_)

console: 0.1

1.1.3 Lasso

1.4 支持向量机

支持向量机的优势：高维空间中高效，维度比样本数量多依然有效，内存利用高效。

缺点：选择核函数避免过拟合。

1.4.1 分类

from sklearn import svm
dataSet = [
    [
        [0,0], [1,1]
    ],
    [
        0,1
    ]
]
clf = svm.SVC(gamma='scale')
clf.fit(dataSet[0], dataSet[1])
print(clf.predict(dataSet[0]))

console: [0 1]

clf.support_vectors_ # 支持向量
clf.support_ # 获得支持向量的索引
clf.n_support_ # 两个类的支持向量的数量

所追寻的风

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
监督学习

1. 监督学习1.1 广义线性模型y是x的线性组合y^(w,x)=w0+w1xp+...+wpxp\hat{y}(w, x) = w_0 + w_1 x_p+...+w_p x_py^(w,x)=w0+w1xp+...+wpxp。求解y与x的回归问题。定义向量w=(w1,...,wp)w = (w_1, ..., w_p)w=(w1,...,wp)作为coef_定义w0w_0w0作为intercept_1.1.1 普通最小二乘法追求残差平方和最小。from sklearn
复制链接

扫一扫