广义线性模型:包括lasso, ridge,elastic net 。
glmnet 只能接受数值矩阵作为模型输入,如果自变量中有离散变量的话,
#需要把这一列离散变量转化为几列只含有 0 和 1 的向量, 这个过程叫做 One Hot Encoding。
除此之外,如果我们想让模型的变量系数都在同一个数量级上,就需要在拟合前对数据的每一列进行标准化(standardize), 即对每个列元素减去这一列的均值然后除以这一列的标准差。这一过程可以通过在 glmnet()
函数中添加参数 standardize=TRUE
来实现。