机器学习
haha_liwei
这个作者很懒,什么都没留下…
展开
-
矩阵求导
这个博客写的相当好。 https://www.cnblogs.com/crackpotisback/p/5545708.html原创 2018-09-26 19:57:20 · 105 阅读 · 0 评论 -
随机森林算法总结
集成学习的概念 集成学习简单来说就是通过构建并结合多个学习器来完成学习任务。 集成学习的一般结构是先产生一组“个体学习器”,在通过一定的策略把它们结合起来结构如下图所示: 集成学习能够通过将多个学习器结合起来,常可获得比单一学习器显著优越的泛化能力,对‘弱分类器‘(常指分化能力略优于随机猜测的学习器)尤为明显,因此集成学习的很多理论研究都是针对弱学习器进行的,而基学习器有时直接成为是弱分类器。 ...原创 2019-01-27 01:29:34 · 5774 阅读 · 0 评论 -
GDBT
CART 决策树有两种类型:分类树和回归树,其中分类树输出是样本的类别,回归树输出的是连续的实数。CART(Classification And Regression Tree)既可以做分类也可以做回归。 CART是在给定输入随机变量X的条件下输出随机变量Y的条件概率分布学习方法。CART书假设决策树是二叉树,内部节点的取值为‘是’和‘否’,这样的决策树等价于递归的二分每一个特征,将输出空间即特征...原创 2019-01-29 18:48:46 · 1210 阅读 · 0 评论 -
达观杯文本处理比赛(一)
初试数据: 数据包含2个csv文件: train_set.csv:此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列: 第一列是文章的索引(id), 第二列是文章正文在“字”级别上的表示,即字符相隔正文(article); 第三列是在“词”级别上的表示,即词语相隔正文(word_seg); 第四列是这篇文章的标注(class)。 注:每一个数字对应...原创 2019-03-01 16:29:33 · 361 阅读 · 0 评论 -
哑编码和独热编码
请看这篇文章,个人感觉写的很好原创 2019-03-27 17:38:41 · 2898 阅读 · 0 评论