自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Nerual Network(神经网络)

神经网络的构由layer(层)和neurons(神经元构成),每一层里面包含一定数量的神经元。此图为一个神经元,输入为不同的参数和其对应的比重,经过神经元的计算输出结果。

2023-08-28 13:24:27 118 1

原创 Lasso & Ridge Regression

Ex. 在房价预测模型中,使用普通线性回归模型可能发现某些值权重非常大,使得这个模型在训练集表现得非常好,但是在测试集中却不尽人意(过拟合)。Lasso回归:Lasso回归通过L1正则化将默写特征的权重完全清零。这意味着在训练过后,有100个特征的数据集中仅有50个特征被视为“有用”,其余50个特征的权重会被降为零,这使得模型更加简洁。正则化是一种技术,通过在模型的目标函数中添加一个罚项,可以有效地控制模型的复杂性,从而避免过拟合。这意味模型将会分散权重到不同的特征上去而不是给予某几个特征非常大的权重。

2023-08-21 14:04:24 195 1

原创 Logistic Regression(逻辑回归)

逻辑回归模型的训练实际上是一个优化问题:找到一组参数 β,使得我们预测的概率尽可能地接近实际标签。这通常通过最大化“对数似然函数”来实现。大于或等于0.5是,我们可以将样本分类为1;为第i个样本的实际标签(0或1),为第i个样本被预测为1的概率,既。小于0.5时,我们将样本分类为0。

2023-08-17 14:11:11 87 1

原创 Polynomial Regression(多项式回归)

当数据的分布不能很好地用一条直线来拟合时,我们可能需要考虑使用多项式回归。多项式回归和线性回归类似,不同的是多项式回归允许一个或多个自变量的幂次方。

2023-08-17 13:59:13 143 1

原创 Gradient Descent(梯度下降)

Ex.假设我们要最小化以下函数:我们的目标是使最小。

2023-08-17 13:53:32 147 1

原创 Correlation Coefficient

这样的关系可以用矩阵来表达,叫做Correlation Matrix。负数:一个特征增长另一个减少。用来找出两者关系的强度。正数:两个特征同时增长。0:这两个特征没有关系。

2023-08-15 12:47:08 50 1

原创 Tabular Data → Matrix → Formula

假设我们给定了一个数组我们可以将这个数组用m-by-n matrix转换成矩阵其中 i(m) 代表rows(行) j(n) 代表columns(列)代表第一行第一列,代表第五行第六列将其转换完我们将会得到一个矩阵(M):如果我们现在有这样一个矩阵M,并有m个样本,通常矩阵中一行为一个样本,一行中不同的值代表这个样本不同的参数。Ex. M矩阵中的第一行代表房屋#1,第一行第一列代表房屋的地址,第一行第二列代表房屋的面积......从上面我们可以得出Where。

2023-08-15 12:42:21 41 1

原创 Cost Function(成本函数)

是Predicted value,从彩色点到直线并垂直于x轴的线。将所有点的误差相加并平方的结果就是成本函数所得出的结果。是Observed value,图中彩色点的y值。机器学习中成本函数L是用于计算误差的一个函数。是彩色线的长度,其含义是单个点的误差。

2023-08-15 11:54:43 117 1

原创 Curve Fitting(曲线拟合)

曲线拟合是一种回归分析的技术,其目标是基于给定数据集找到一个最合适的函数,与线性回归不同,这个函数可能是非线性的。

2023-08-15 11:43:54 298 1

原创 Linear Regression Model(线性回归模型)

模型参数是特征变量的系数,它们描述了每个特征变量对这个模型的影响。还是上面的房价预测模型,假设n=1代表面积,n=2代表地理位置,n=3代表建造年份。特征变量是我们用来预测结果(y)时输入的变量,这些变量可以是年龄,性别,体重等等。Ex. 在房价预测模型中,房屋面积,地理位置,建造年份等都可以作为特征变量用来响应房价。为0的时候这个模型该如何响应,或者说这个值可以上下移动模型所预测出来的线。,这就说明地理位置对房价影响最大,其次是房屋面积,最后是建造年份。

2023-08-15 11:35:41 270 1

原创 Cross Validation(交叉验证)

假设我现在有一个数据集,我将数据集分成十份(k = 10),这十个数据集分别命名为d1, d2, d3,..., d10。这个模型会有十次迭代(迭代数量=k),k - 1数量的subdataset会被用于训练,剩下的哪一个会被用于测试。如果先将d1设为测试集,那么d2到d9会被设为训练集,第二次迭代将会用d2作为测试集直到d10。

2023-08-15 11:08:59 76 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除