广义线性模型的流式学习
1. 广义线性模型的组成
在这篇博客中,我们将介绍机器学习中最常用的一大类模型:广义线性模型。广义线性模型包含线性模型、逻辑斯特回归、岭回归、Lasso等。这几种模型在spark中均有实现,然而,还未有基于spark streaming的流式算法。
2. 本文符号
假设我们有n个数据,分别为,每个数据的维度为k,在广义线性模型中,我们将这n个数据集中到一个矩阵
中,其中A的每一行为一个数据。每个数据对应的标签为
,注意每个标签是一个(0,1)的数,我们把这n个数集合到一个向量
中。另外,我们假设广义线性模型中需要学习的参数为x&#