机器学习
YeehuiWu
By your hand,you shall know glories of your progeny.
展开
-
随机森林随笔(二)
2018年6月26日 多云随机森林随笔(一) 粗略地介绍了决策树学习,下面开始谈谈随机森林的构建.在说到随机森林之前,还得提到一个概念:集成学习.集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system)、基于委员会的学习(committee-based learning)等.集成学习的一般结构是...原创 2018-06-26 14:53:15 · 334 阅读 · 0 评论 -
随机森林随笔(一)
2018年6月20日 多云终于开始动笔写点随机森林的东西,随机森林之前也接触过,但第一次感受到随机森林的魅力是看了周志华的这篇文章:Deep forest: Towards an alternative to deep neural networks,Github上也有源码,调试了一番也跑出来(建议在Linux环境下跑).说起随机森林,就必然要谈到决策树学习.决策树学习是很多先进算法的基础,包括随...原创 2018-06-20 16:01:20 · 433 阅读 · 0 评论 -
随机森林随机(三)
2018年7月22日 阵雨 感冒发烧喉咙疼,只因为一杯正常冰的奶盖!!!以后得少喝加冰的东西了. 前面说的是集成学习的两种形式,这跟随机森林有啥关系呢? 随机森林是Bagging的一个扩展变体.简单的来说,当Bagging算法中的base learner为决策树并在训练决策树的过程中加入随机属性选择,这就是随机森林的由来. 我们知道,传统的决策树的构建是在当前结点的属性集合(假定有d个属性...原创 2018-07-22 20:45:29 · 333 阅读 · 0 评论 -
自然语言处理之文本表示模型
# 文本表示模型 常见的文本表示模型有:词袋模型(Bag of Words),主题模型(Topic Model),词嵌入模型(Word Embedding) ## 词袋模型 词袋模型是将每篇文章看成一袋子的词,并忽略每个词出现的顺序。具体来说,就是将整段文本以词为单位且分开,然后每篇文章可以表示成一个长向量,向量中的每一维代表一个单词,而该维对应的权重则反映了这个词在原文章中重要程度。常用T...原创 2019-02-27 20:58:26 · 3850 阅读 · 0 评论