机器学习
文章平均质量分 95
木女Dawn
IT菜鸟一枚
展开
-
机器学习分类问题中,数据不均衡时的解决方法
数据不均衡是指数据集中每种类别的数据的数量相差比较大。比如一个数据集S中,a类数据有100个,b类有1个,一般相差一个以上数量级的就算是数据不均衡了,需要进行预处理。 数据不均衡会导致最终的分类结果有偏差。同样以数据集S作为说明,如果不作任何处理直接用S作为训练数据,那么用训练模型对一个新的数据进行测试,得到的结果将有约100/(100+1)即近似为1的概率被预测为类别a,而被预测为b类的概率只...转载 2018-04-19 14:35:24 · 1763 阅读 · 0 评论 -
斯坦福大学machine learning课程学习笔记
第1、2周课程及编程作业1 (基于matlab/octave语言) 一、线性回归的实现(ex1.m) 1、warmUpExercise.m 该函数的功能是生成一个5*5的单位矩阵(正对角线为1,其它位置为0的矩阵)。有两种方法实现: (1)使用matlab中的函数eye():A=eye(5)。 eye()函数用来生成单位矩阵。 A = eye(m):生成m*m单位...原创 2018-07-21 13:39:14 · 406 阅读 · 0 评论