统计学
文章平均质量分 76
五只鸭子
数据人
展开
-
岭回归:优化预测的利器
在数据科学和机器学习的领域,构建准确、稳定的预测模型是一项至关重要的任务。岭回归作为一种强大的工具,被设计用来应对数据集中存在多重共线性的问题,并通过引入正则化来缩小预测误差。岭回归是线性回归的一种扩展形式,通过在损失函数中引入L2正则化项,控制模型的复杂度。其中,yi 是观测值,xij 是特征矩阵的元素,β0 是截距项,βj 是自变量的系数,α 是正则化参数。原创 2024-03-12 23:43:33 · 396 阅读 · 0 评论 -
概率与常见的概率分布
概率是数据分析、机器学习中最基础的知识。也是在生活中最实用的一门学科,学了很多大道理不一定能过好一生,学好概率则有一定概率会变得更好。原创 2024-03-12 23:34:32 · 1003 阅读 · 0 评论 -
线性代数:向量、张量、矩阵和标量
标量是数学中的一个基本概念,它表示一个单独的实数,没有方向或位置。在数学表示中,我们通常用小写字母表示标量,例如 a 或 x。向量是有序的一维数组,其中包含多个标量元素。每个元素都有一个索引,表示其在向量中的位置。在数学表示中,我们通常用小写粗体字母表示向量,如v。矩阵是一个二维数组,其中包含多个标量元素,这些元素按行和列排列。在数学表示中,我们通常用大写字母表示矩阵,如 A。在线性代数里面可以简单的将张量理解为一个多维数组,可以包含标量、向量和矩阵。在数学表示中,我们通常用大写粗体字母表示张量,如T。原创 2024-02-23 21:57:28 · 1747 阅读 · 1 评论 -
常见的20种数据值异常检验方法
数据值异常是指在数据集中存在一些与其他数据值相比较不符的值。这些异常值有可能是由于数据录入错误、测量偏差或者其他未知原因导致的。数据值异常对数据分析和建模的结果产生了不利的影响,因此需要进行检验和处理。原创 2023-04-29 17:29:19 · 4414 阅读 · 2 评论 -
各种平均值:算术平均值,几何平均值,调和平均值等
平均数反映了一组数据的一般水平,最常见的平均数是算术平均数,除了算数平均数外,还有几何平均数,调和平均数,加权平均数等。原创 2022-10-10 20:14:03 · 13501 阅读 · 0 评论