基础知识
_Junwei
deep learning,数据挖掘,推荐系统
展开
-
XGboost
转载:https://www.cnblogs.com/zongfa/p/9324684.html机器学习--boosting家族之XGBoost算法一、概念 XGBoost全名叫(eXtreme Gradient Boosting)极端梯度提升,经常被用在一些比赛中,其效果显著。它是大规模并行boosted tree的工具,它是目前最快最好的开源boosted tree工具包。...转载 2019-12-28 08:20:56 · 399 阅读 · 0 评论 -
Kullback-Leibler Divergence
转载自:http://blog.csdn.net/zhaoyue007101/article/details/8773220 原博客图片被屏蔽掉,无法显示KL距离全称为Kullback-Leibler Divergence,也被称为相对熵。公式为:感性的理解,KL距离可以解释为在相同的事件空间P(x)中两个概率P(x)和Q(x)分布的差异情况。从其物理意义上分析:可解释为在转载 2016-10-17 20:21:06 · 5195 阅读 · 0 评论 -
多类分类(Multi-label classification)性能评价之宏平均(macro-average)与微平均(micro-average)
http://blog.csdn.net/u010551621/article/details/46907575通常,我们在评价classifier的性能时使用的是accuracy考虑在多类分类的背景下accuracy = (分类正确的样本个数) / (分类的所有样本个数)这样做其实看上去也挺不错的,不过可能会出现一个很严重的问题:例如某一个不透明的袋子里面装了1000转载 2016-12-15 13:30:18 · 1921 阅读 · 0 评论 -
矩阵求导方法
转载至:http://www.cnblogs.com/huashiyiqike/p/3568922.html https://blog.csdn.net/daaikuaichuan/article/details/80620518转载 2017-03-12 16:11:50 · 313 阅读 · 0 评论 -
关于正则化的理解
https://www.cnblogs.com/jianxinzhou/p/4083921.html转载 2017-11-23 15:41:58 · 705 阅读 · 0 评论 -
UNICODE,GBK,UTF-8的区别
转载自:https://www.cnblogs.com/gavin-num1/p/5170247.html UNICODE,GBK,UTF-8区别 一、编码历史与区别 一直对字符的各种编码方式懵懵懂懂,什么ANSI UNICODE UTF-8 GB2312 GBK DBCS UCS……是不是看的很晕,假如您细细的阅读本文你一定可以清晰的理解他们。Let's go...转载 2018-11-07 13:36:00 · 160 阅读 · 0 评论 -
向量范数与矩阵范数
转载自:https://blog.csdn.net/bitcarmanlee/article/details/519452711.范数(norm)的意义要更好的理解范数,就要从函数、几何与矩阵的角度去理解。 我们都知道,函数与几何图形往往是有对应的关系,这个很好想象,特别是在三维以下的空间内,函数是几何图像的数学概括,而几何图像是函数的高度形象化,比如一个函数对应几何空间上若干点组成的图形...转载 2018-11-05 19:01:15 · 546 阅读 · 0 评论 -
【通俗理解】显著性检验,T-test,P-value
转载:https://blog.csdn.net/guomutian911/article/details/81604545显著性检验,判定实验结果是否由随机误差导致的。举例很好,很清楚虽然样本中,均值苏州销售额大于郑州,但T-test发现这是随机导致的,P>0.05,当样本量足够大可能他们的销售额就没有差异了假设:两个样本集之间不存在任何区别结果:在显著性水平α =0.05...转载 2018-11-12 11:47:08 · 9625 阅读 · 0 评论