算法
文章平均质量分 53
代码_c
这个作者很懒,什么都没留下…
展开
-
precision、recall和accuracy
- TP,True Positive - FP,False Positive - TN,True Negative - FN,False Negativeeg:判定某邮件是否是垃圾邮件如果判定是垃圾邮件,那就是做出(Positive)的判定; 如果判定不是垃圾邮件,那就做出(Negative)的判定。True Positive(TP)意思表示做出Positive的判定,而且判定是正确的。False...原创 2018-02-28 17:22:14 · 409 阅读 · 0 评论 -
皮尔逊系数
在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。总体相关系数;估算样本的协方差和标准差,可得到皮尔逊相关系数。https://baik...原创 2018-03-12 21:59:45 · 1242 阅读 · 0 评论 -
规范化、标准化、归一化、正则化
规范化:针对数据库规范化把关系满足的规范要求分为几级,满足要求最低的是第一范式(1NF),再来是第二范式、第三范式、BC范式和4NF、5NF等等,范数的等级越高,满足的约束集条件越严格。针对数据数据的规范化包括归一化标准化正则化,是一个统称(也有人把标准化作为统称)。数据规范化是数据挖掘中的数据变换的一种方式,数据变换将数据变换或统一成适合于数据挖掘的形式,将被挖掘对象的属性数据按...原创 2018-07-18 21:52:39 · 29316 阅读 · 0 评论 -
统计学习方法-一些概念
统计学习方法三要素模型:模型的假设空间,即假设要学习的模型属于某个函数的集合,即有输入空间到输出空间的映射的集合 策略:模型选择的标准 算法:模型学习的算法,实现求解最优模型的算法统计学习包括监督学习、非监督学习、半监督学习、强化学习。根据输入输出变量类型的不同,对预测任务给予不同的名称:输入、输出均为连续变量:回归问题 输入为连续变量,输出为离散变量:分类问题 输入和输出均...原创 2018-07-29 19:14:47 · 126 阅读 · 0 评论