机器学习常见数据概念

1、协方差:

计算两个变量在变化过程中的相似度,同向运动程度越高,值越大。

2、相关系数:

标准差:反映数据的离散程度,数据离散度越大,标准差越大。

通过标准差,将协方差的值约束到一定范围内,去除协方差运动幅度的影响,只保留运动的相似度(相关度),这就是相关系数。

>0 and <=1 正相关; =0 不想关 ;>-1 and <0 负相关 。

3、方差

描述样本与均值的偏离程度

4、标准差

代表了样本的散度,值越小,散度越低。

 5、均方差

评价观测值和真实值之间误差,常用做线性模型的损失函数。

 

 

6、熵、kl散度(Kullback-Leibler (KL) divergence)、交叉熵

熵:

p(x)每一种可能的概率

kl散度:

p(x)、q(x) 两种分布下的,同一个变量的概率(训练样本/测试样本?)

H(p(x))为熵,做为训练样本时,是常数,因此剩余部分可以代表散度,即交叉熵。 

交叉熵:

常用做损失函数,用来评价样本差异度。

 

参考:https://blog.csdn.net/tsyccnh/article/details/79163834

 

 

 

---待不断完善

 

转载于:https://www.cnblogs.com/evening/p/9633270.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值