机器学习
学习炒菜的小芹菜
中科院自动化所在读
展开
-
KL散度
KL 散度是一种衡量两个概率分布的匹配程度的指标,两个分布差异越大,KL散度越大。定义如下:p(x) 是目标分布,q(x)是去匹配的分布,如果两个分布完全匹配,那么散度又叫相对熵,在信息论中,描述的是q去拟合p的产品的信息损耗。KL 散度是非对称,即 D(p||q) 不一定等于 D(q||p) 。KL 散度经常作为优化的目标。...原创 2019-10-25 23:07:00 · 164 阅读 · 0 评论 -
非线性分类——决策树
今天我们来讲非线性分类器。为什么要使用非线性分类器呢?因为有时候数据未必是线性可分的。常见的非线性方法有:线性扩展的思想线性扩展模型。即把非线性数据通过一个非线性转换,变为新的数据分布,并且这些数据符合线性分布。这样就可以使用线性方法进行分类处理。核函数方法。2.非线性的思想最近邻k近邻决策树神经网络集成学习决策树决策树的目标:产生一棵泛化能力强的决策树。决策...原创 2019-10-25 10:48:44 · 800 阅读 · 0 评论 -
UCI 机器学习数据集
目录UCL网址部分数据集介绍UCL网址部分数据集介绍鸢尾花鸢尾花是最常用的模式识别数据集。该数据集包含3个类,每个类包含50个实例,其中每个类指的是一种虹膜植物。第一类可以与后两类线性分离; 后两类不能彼此线性分离。预测属性attribute:鸢尾花类别一共5列,第5列是类别。...原创 2019-07-04 10:52:49 · 2074 阅读 · 0 评论