机器学习
文章平均质量分 90
玩世彳不恭
这个作者很懒,什么都没留下…
展开
-
sklearn-数据预处理
数据预处理数据预处理概要Z-score标准化MinMax标准化MaxAbs标准化正则化阈值划分离散变量编码缺失值处理维度拓展自定义变换规则概要sklearn是一个比较常用的机器学习库,其中的sklearn.preprocessing包含了常用的预处理函数,一般在kaggle等数据竞赛网站拿到数据的时候,首先要观察数据特征,分布等信息,然后进行数据预处理。数据预处理有利于计算机进行原创 2017-03-09 10:49:32 · 3612 阅读 · 0 评论 -
机器学习-概率分布(PRML 第二章总结)
概率分布概率分布离散变量1伯努利分布2二项分布3多项式分布连续变量1 beta分布2 狄利克雷分布3 高斯分布极大似然估计最大后验估计贝叶斯估计1.离散变量1.1伯努利分布伯努利分布,进行一次伯努利实验,如投掷一次硬币,x=1x=1代表正面,其概率为μ\mu,x=0x=0代表反面,其概率为1−μ1-\mu。 p(x|μ)=ux(1−u)1−xp(x|\mu)=u^x(1-u原创 2017-02-16 19:00:42 · 1466 阅读 · 0 评论