- 博客(4)
- 收藏
- 关注
原创 为什么要特征标准化及特征标准化方法
归一化化定义:归一化化就是要把你需要处理的数据经过处理后(通过某种算法)限制在你需要的一定范围内。归一化的原因是什么那:一是为了后面数据处理的方便,把不同量纲的东西放在同一量纲下比较,即把不同来源的数据统一到一个参考系下,这样比较起来才有意义。特征标准化
2016-07-22 10:52:30 19736
转载 特征选择常用算法综述
1 综述(1) 什么是特征选择特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ) ,或属性选择( Attribute Selection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。 (2) 为什么要做特征选择 在机器学习的实际应用中,特征数量往往较多,其
2016-07-19 14:23:01 21578
原创 指数分布与幂律分布定义及不同(泊松分布、伽马分布)
1、定义(1)幂律分布(pow law distribution),其概率密度函数形式如下,这种分布的共性是绝大多数事件的规模很小,而只有少数事件的规模相当大。y=cx-r其中x,y是正的随机变量,c,r均为大于零的常数。对上式两边取对数,可知lny与lnx满足线性关系lny=lnc-rlnx,也即在双对数坐标下,幂律分布表现为一条斜率为幂指数的负数的直线,这一线性关系是判断给
2016-07-18 17:18:00 16654
转载 卡方检验x2检验(chi-square test)
x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。 一、四格表资料的x2检验 例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?表20-11 两种疗法治疗卵巢癌的疗效比较
2016-07-07 16:31:01 70198
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人