Big Data Analytics 笔记整理 1

B栋3食堂

已于 2022-03-02 16:48:44 修改

阅读量365

点赞数

分类专栏：数学文章标签： big data 大数据机器学习回归

于 2022-02-21 00:38:36 首次发布

本文链接：https://blog.csdn.net/MINGRAN_JIA/article/details/122933308

版权

数学专栏收录该内容

8 篇文章 0 订阅

订阅专栏

Content

Cross Validation
Cost Function

Cross Validation

random subsampling:
k-fold
leave one out

Cost Function

减少预测误差 (prediction error) ——预测值和真实值的差异，这种差异一般用error metric量化
Error Metric：

cost function
loss fuction (machine learning)
objective function (optimization)
utility function (equal to negative cost, used in decision theory)

Cost Function
MSE, RMSE, MAE, FP & FN, F1 scores

$\frac{1}{n} \sum^{n}_{i=1}{(true - approximation)}^2\\ = \frac{1}{n_d}\sum^{n_d}_{i=1}(y_i-x_i ^\mathsf{T}\hat{\theta})^2$

$\sqrt{MSE}$
$MAE(\hat{y}) = \frac{1}{n} \sum^{n}_{i=1}{|y_i - \hat{y_i}|}$
TP: True positive; FP: false positive; TN: true negetive; FN: false negetive

$P(\hat{y}\mid y)$	$y = 1$	$y = 0$
$\hat{y}=1$	TP	FP
$\hat{y}=0$	FN	TN

$\mathrm{Recall}=\mathrm{Sensitivity} = \frac{TP}{TP+FN}$
$\mathrm{Specificity} = \frac{TN}{FP+TN}$

$\mathrm{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN}$
$\mathrm{True~positive~rate~(TPR)}=\mathrm{Sensitivity}$
$\mathrm{False~positive~rate~(FPR)}=1-\mathrm{Specificity}$
If the data is skewed (数据倾斜)：
$\mathrm{Precision}=\frac{TP}{TP+FP}$
$\mathrm{F_1~score}=2\left(\frac{precision \times recall}{precision + recall}\right)$

B栋3食堂

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Big Data Analytics 笔记整理 1

Cross Validationrandom subsampling:k-foldleave one outCost Function减少预测误差 (prediction error) ——预测值和真实值的差异，这种差异一般用error metric量化Error Metric：cost functionloss fuction (machine learning)objective function (optimization)
复制链接

扫一扫

专栏目录