建模算法及数理基础
cd651
这个作者很懒,什么都没留下…
展开
-
关于数据缺失
关于数据缺失问题的总结作者:enova 摘自:《计算机科学论坛》 造成数据缺失的原因 在各种实用的数据库中,属性值缺失的情况经常发全甚至是不可避免的。因此,在大多数情况下,信息系统是不完备的,或者说存在某种程度的不完备。造成数据缺失的原因是多方面的,主要可能有以下几种: 1)有些信息暂时无法获取。例如在医疗数据库中,并非所有病人的所有临床检验结果都能在给定的时间内得到,就致使一转载 2017-10-11 18:25:44 · 605 阅读 · 0 评论 -
主成分分析法
(1)目的及方法概述: we intend to rank the * based on the correlation between the ’s identity and our focus. Since we make use of indicator with complex interactions ,we ought to extract a few principle indic原创 2017-10-28 17:56:28 · 389 阅读 · 0 评论 -
熵、交叉熵、交叉熵方法
信息量熵相对熵交叉熵 衡量label和predict的差异看此篇的内容CEM 交叉熵方法:交叉熵方法是一种蒙特卡洛方法,主要用来优化和重要性采样。和进化算法类似,在空间中按照某种规则撒点,获得每个点的误差,再根据这些误差信息决定下一轮撒点的规则。交叉熵方法之所以叫这个名字,是因为该方法(从理论上来说)目标是最小化随机撒点得到的数据分布与数据实际分布的交叉熵(等价于最小化 KL...原创 2018-11-01 16:49:12 · 2095 阅读 · 0 评论 -
张量概念及基本运算
tensor一阶张量:vector二阶张量:matrix 例如用户对电影评价表,每行表示一个用户,每列表示一部电影。矩阵中的值表示评价值。三阶张量:例如上例中再加一个时间维度。还如用户关注某个主题的名人,每个值为1表示该用户关注了某主题下某个名人。。。。传统的方法(例如ICA,PCA、SVD和NMF)对于维数比较高的数据,一般将数据展成二维的数据形式(矩阵)进行处理,这种处理方式使得数...原创 2018-11-04 20:50:59 · 29136 阅读 · 0 评论 -
LSH局部敏感哈希-求解海量数据的最近邻
参考此篇原创 2018-11-05 21:13:07 · 626 阅读 · 0 评论 -
拉普拉斯矩阵
图论此篇的定义及简单性质原创 2018-11-11 22:08:08 · 694 阅读 · 0 评论 -
PCA推导
虽然PCA是最常用的最基础的算法,但总是不清楚PCA的具体原理。大神讲解传送带实际上等价的那个地方有一点问题,就是W‘X的每一行并没有中心化,所以其乘以转置对角线上的元素似乎不是某一行的方差...原创 2018-11-20 22:59:02 · 305 阅读 · 0 评论 -
矩阵运算技巧总结
1、列向量×行向量×列向量似乎满足结合律1、列向量\times行向量\times列向量 似乎满足结合律1、列向量×行向量×列向量似乎满足结合律原创 2019-10-03 17:05:47 · 1672 阅读 · 0 评论