自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 正则化的概念

norm:一个向量的 norm 就是将该向量投影到 [0, ∞​) 范围内的值,其中 0 值只有零向量的 norm 取到。逻辑回归模型的参数优化一般采用了梯度下降法,如果不对特征进行归一化,可能会使得损失函数值得等高线呈椭球形,这样花费更多的迭代步数才能到达最优解。针对线性回归模型,假设对其代价函数里加入正则化项,其中L1和L2正则化项的表示分别如下所示,其中λ >= 0。逻辑回归模型的损失函数可以加入正则项,那么参数的大小便决定了损失函数值,特征就有必要先进行归一化。LAD:预测值与真实值之间的绝对值。

2024-03-06 10:16:07 542

原创 协方差矩阵-----------------------奇异值

描述随机变量之间的相互关系。即一个变量的变化如何影响另一个变量。当数据集变量间不相关,协方差矩阵是对角矩阵,协方差为0,也是正定矩阵,存在逆矩阵。当数据集变量间线形相关,协方差矩阵是奇异的,矩阵的逆矩阵则不存在,导致问题。基于协方差矩阵的统计方法可能不可靠,例如:在MASS包LDA函数中,是协方差矩阵中奇异性的容差水平,tol = 1.0e-4是举例的容忍度。

2024-03-04 16:27:56 263 1

原创 tableone详细解析(3)------连续型变量和分类变量

以下举例对哪些变量进行exact test:exact=c(""),对哪些变量进行二分类变量全部信息展示 :cramVars="",展示全部SMD:smd=TRUE。——————————————————我是一个倔强的分割线———————————————dput(names(数据框))这个函数可太棒了,直接粘贴变量。tableone用到的示例数据库和默认参数详细的解释在。查看tableone的信息,可以进行输出内容的设置。先用lapply()把分类变量转换成factor。单独查看分类变量或连续性变量也可以。

2024-03-04 09:18:02 459 1

原创 tableone详细解析(2)------连续型变量

通过本数据集偏度skew 和 峰度kurt的结果,可以看到"bilil","chol","copper","alk.phos","trig","protime"是明显偏态的。"max", "skew", "kurt"),#您可以选择它们的子集,也可以对它们进行重新排序。默认为(NA.rm=TRUE),无需设置。——————————————————我是一个分隔符————————————-———————————————————下面是manu全部代码,可跳过——————————————

2024-03-03 14:30:00 1599

原创 tableone详细解析(1)------分类变量

table one用于分类变量

2024-03-02 15:49:47 1832 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除