数据挖掘
文章平均质量分 77
xsqlx
大数据研究,数据挖掘,个性化推荐
展开
-
决策树的数学原理
说到决策树,大家肯定不陌生,由于其结构简单,学习成本低,且可解释性强,有着广泛的应用。因此各类书籍、技术博客都有介绍,且深入浅出、图文并茂、生动形象。 鉴于已经有很多带图的博客介绍决策树,这里就不上图了,主要以公式推导为主。 本文主要分三块内容来介绍决策树:首先会简单回顾下决策树的内容,由于这部分相对简单,大家了解的也多,因此会快速过一遍。随后本文会对决策树的数学原理原创 2016-04-11 11:55:44 · 12560 阅读 · 6 评论 -
深入理解GBDT
GBDT 全称为 Gradient Boosting Decision Tree。顾名思义,它是一种基于决策树(decision tree)实现的分类回归算法。不难发现,GBDT 有两部分组成: gradient boosting, decision tree。Boosting 作为一种模型组合方式,与gradient descent 有很深的渊源,它们之间究竟有什么关系?原创 2016-05-06 12:59:23 · 10128 阅读 · 0 评论 -
Multinomial 回归多分类推导
关于多分类问题,一般来讲有两种常见方法:1. one vs rest [“ovr”]; 2. Multinomial 回归。本文介绍的为第二种方式,即: 假设样本的目标变量服从Multinomial Distribution, 通过最大化目标变量的似然概率来求得模型的解。原创 2017-08-02 22:04:31 · 1543 阅读 · 0 评论 -
基于fork + pipe的数据快速打横处理
这里写自定义目录标题需求新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入需求序列数据(sequencial ...原创 2018-12-03 23:14:07 · 408 阅读 · 0 评论