自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 聚类算法

聚类 无监督学习,标记信息未知,通过对无标记训练样本的学习来揭示数据的内在性质及规律 聚类将数据集中的样本划分为若干个不相交的子集(簇) 潜在概念(类别) 可作为单独过程,寻找分布结构,也可作为分类等其他学习任务的前驱过程 性能度量 簇内相似度高,簇间相似度低 一类是与某个参考模型进行比较,外部指标 a=|SS|,在C中属于相同簇在C*中也属于相同簇的样本对 b=|SD|,在C中属于相同簇...

2019-09-16 17:52:14 180 1

原创 集成

集成 通过构建并结合多个学习器来完成学习任务 个体学习期要有一定的 简单投票法,超过半数分类正确,集成分类就正确 Hoeffding不等式可知,随着分类器数目T的增大,集成的错误率将指数级下降 目的降低偏差 boosting – 要求基学习器能够对特定的数据分布进行学习,通过“重赋权法实施”,对于无法接受带权样本的基学习算法,通过重采样法来处理,每一轮学习中,根据样本分布对训练集重新进行采样。...

2019-09-11 22:17:41 314

原创 bagging 集成

bagging 集成 基于自助采样法 每次选择m个样本 基于每个采样集训练出一个基学习器 然后将这些基学习器进行结合 关注降低方差 from sklearn.ensemble import BaggingClassifier base_estimator=None, n_estimators=10, max_samples=1.0, max_features=1.0, bootstrap=Tru...

2019-09-11 22:17:11 263

原创 损失函数

损失函数 模型误差 = 偏差(Bias)+ 方差(Variance)+ 数据本身的误差。其中数据本身的误差,可能由于记录过程中的一些不确定性因素等导致,这个我们无法避免,能做的只有不断优化模型参数来权衡偏差和方差,使得模型误差尽可能降到最低。 loss function LogLoss 对数损失函数(binary cross entropy) hinge loss(合页损失函数,SVM) 最小...

2019-09-11 22:14:53 142

原创 决策树算法 sklearn使用

决策树算法 sklearn使用 一棵树,从根结点开始划分,向下不断分裂,分而治之 叶子结点得出决策结果 from sklearn import tree.DecisionTreeClassifier (criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_we...

2019-09-11 20:23:45 229

原创 开始写博客

2019年7月18日开始写博客啦。 日常技术钻研过程中遇到的问题都会写在这里。 也会对某些方面的知识做一些总结。 主要集中于python,c++,数据分析与挖掘,机器学习。 ...

2019-07-18 22:46:33 76

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除