ossorry-CSDN博客

原创聚类算法

聚类无监督学习，标记信息未知，通过对无标记训练样本的学习来揭示数据的内在性质及规律聚类将数据集中的样本划分为若干个不相交的子集（簇）潜在概念（类别）可作为单独过程，寻找分布结构，也可作为分类等其他学习任务的前驱过程性能度量簇内相似度高，簇间相似度低一类是与某个参考模型进行比较，外部指标a=|SS|,在C中属于相同簇在C*中也属于相同簇的样本对b=|SD|,在C中属于相同簇...

2019-09-16 17:52:14 224 1

原创集成

集成通过构建并结合多个学习器来完成学习任务个体学习期要有一定的简单投票法，超过半数分类正确，集成分类就正确Hoeffding不等式可知，随着分类器数目T的增大，集成的错误率将指数级下降目的降低偏差boosting– 要求基学习器能够对特定的数据分布进行学习，通过“重赋权法实施”，对于无法接受带权样本的基学习算法，通过重采样法来处理，每一轮学习中，根据样本分布对训练集重新进行采样。...

2019-09-11 22:17:41 348

原创 bagging 集成

bagging 集成基于自助采样法每次选择m个样本基于每个采样集训练出一个基学习器然后将这些基学习器进行结合关注降低方差from sklearn.ensemble import BaggingClassifierbase_estimator=None, n_estimators=10,max_samples=1.0, max_features=1.0, bootstrap=Tru...

2019-09-11 22:17:11 304

原创损失函数

损失函数模型误差 = 偏差（Bias）+ 方差（Variance）+ 数据本身的误差。其中数据本身的误差，可能由于记录过程中的一些不确定性因素等导致，这个我们无法避免，能做的只有不断优化模型参数来权衡偏差和方差，使得模型误差尽可能降到最低。loss functionLogLoss 对数损失函数（binary cross entropy）hinge loss（合页损失函数，SVM)最小...

2019-09-11 22:14:53 169

原创决策树算法 sklearn使用

决策树算法 sklearn使用一棵树,从根结点开始划分，向下不断分裂，分而治之叶子结点得出决策结果from sklearn import tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None,min_samples_split=2, min_samples_leaf=1,min_we...

2019-09-11 20:23:45 255

原创开始写博客

2019年7月18日开始写博客啦。日常技术钻研过程中遇到的问题都会写在这里。也会对某些方面的知识做一些总结。主要集中于python，c++，数据分析与挖掘，机器学习。...

2019-07-18 22:46:33 90

qq_32172061的博客

原创聚类算法

原创集成

原创 bagging 集成

原创损失函数

原创决策树算法 sklearn使用

原创开始写博客

空空如也

空空如也

原创 聚类算法

原创 集成

原创 bagging 集成

原创 损失函数

原创 决策树算法 sklearn使用

原创 开始写博客

空空如也

空空如也

原创聚类算法

原创集成

原创损失函数

原创决策树算法 sklearn使用

原创开始写博客