- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 K-Means算法
1. 算法思想 K-Means算法,也称为K-均值算法,是一种无监督算法,即数据集无标签。一般做法是,往往先对数据进行聚类,根据聚类结果将每个簇定义为一个类,然后再基于这些类训练分类模型,输入测试样本判断类别。 聚类就是将数据集中的样本划分到指定数量的互不相干的子集中,每个子集就是一个簇。2. 算法流程 ...
2018-11-18 22:21:30 333
原创 AdaBoost.M1算法
1. 算法思想 AdaBoost.M1算法是基于AdaBoost算法的一个改进版本,当然还有第二个,称之为AdaBoost.M2算法,两种算法详情请参阅论文《Experiments with a New Boosting Algorithm》。 最早的AdaBoost算法是一种二分类算法,类标签为{+1,-1},该算法计算基分类器的分类误差率和权重参数都是基于此...
2018-11-14 10:16:56 5449 4
原创 AdaBoost算法
1. 算法思想 基于串行集成的策略,加权综合考虑各个基分类器预测的结果,获得最终的预测结果。通俗讲就是,“三个臭皮匠,顶一个诸葛亮”,为每个人的建议设置一个权值,各抒己见,最后综合计算合理的答案。 首先,初始化所有样本的权重都相同,基于基分类器预测此数据集在权重分布下的预测结果;然后,根据此基分类器的预测结果和真实标签计算此时的分类错误率,并依据分类错误率继续计算此基...
2018-11-13 17:07:21 338
原创 PCA算法
1. PCA算法思想在数据预处理过程中,为了降低计算计算复杂度,可删除相关性较大的特征,从而可以不用丢失太多的信息。通过基变换,将数据投影到新的坐标中,即可获得全新的K个正交特征。2. 推导过程⑴给出不同的基可以对同一组数据给出不同的表示,当基的维数小于数据的特征数时,则实现了数据降维。⑵为了保留更多的信息,需寻找最优基。(保留更多的信息,令每个基上的投影方差最大;新特征彼此...
2018-11-02 22:05:26 2191
学习OpenCV的三本书
2018-06-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人