- 博客(2)
- 收藏
- 关注
原创 机器学习方法篇(28)------降维和度量学习
● 每周一言。导语在特征提取过程中,有时候会遇到特征维数非常大(维数灾难)的情况,这种情况会带来两个主要问题:一是样本稀疏大大削弱了特征表达能力,二是高维数所带来的庞大计算量。降维和度量学习便是维数灾难的解决之法。那么,究竟什么是降维和度量学习?降维和度量学习首先我们来讲讲这个“维数灾难”。特征维数变大之后,为什么会出现“灾难”?不妨举一个例子来直观理解:比如一个分类问题,...
2018-05-27 18:07:01 1109
原创 样本不均衡问题调研
● 每周一言。导语在有监督的模型训练中,多多少少都会遇到样本不均衡(Imbalanced Data)的问题,样本不均衡将导致模型学习不到想学到的知识。比如癌症预测模型,相比健康人而言,患癌病人的数量本来就很少,这样数据不平衡的问题很大程度上限制了模型的能力。那么,如何解决样本的不均衡呢?样本不均衡样本不均衡简而言之,就是不同类别标签的样本之间的数量差别较大。由于多分类问题可以转...
2018-05-20 16:54:34 2495
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人