学习笔记
kindred_joe
这个作者很懒,什么都没留下…
展开
-
《统计学习方法》阅读笔记-Ch02 k近邻法
Ch02 k近邻法目录k近邻算法k近邻模型kd树k近邻算法k近邻算法比较简单。可以理解为,给定一个未知样本,通过与已有样本之间的距离度量来判断未知样本的类别。k的意思是针对距离最近的k个已知样本对未知样本进行分类决策表决。k近邻模型觉得k近邻中最关键的是距离的度量方法与分类表决决策。距离度量方法在书中介绍了Lp距离计算方法。当p=1时为曼哈顿距离,p=2时为欧式距离。假...原创 2019-09-24 21:30:56 · 276 阅读 · 0 评论 -
《统计学习方法》阅读笔记 Ch05 决策树
Ch05 决策树目录模型特征选择决策树生成剪枝CART连续值与缺失值多变量决策树模型决策树的模型觉得很简单。就是从每个特征出发对数据进行划分,叶子节点就是划分出的有相同类的样本集合。中间节点可以认为是划分依据。书中决策树可以理解为if-then规则的集合,并且和条件概率有一定的关系。特征选择熵特征选择或者说特征划分,理解为中间节点应该选择那个特征划分样本集。特...原创 2019-09-25 21:13:23 · 330 阅读 · 0 评论 -
《统计学习方法》阅读笔记 Ch8 提升方法
Ch8 提升方法目录参考《百面机器学习》Ch12 集成学习西瓜书 Ch8 集成学习原创 2019-09-28 21:57:39 · 172 阅读 · 0 评论 -
《机器学习》 阅读笔记 Ch8 集成学习
Ch8 集成学习目录TaxonomyBoostingBagging随机森林结合策略Taxonomy根据个体学习器的差异,集成学习分为boosting和bagging。boosting中,个体学习器存在强依赖关系,必须串行序列化生成。bagging中,个体学习器不存在强依赖关系,可并行生成。BoostingAdaBoost的核心步骤就是计算基学习器权重和样本权重分布。...原创 2019-09-29 15:55:53 · 267 阅读 · 0 评论