机器学习
haha_liwei
这个作者很懒,什么都没留下…
展开
-
矩阵求导
这个博客写的相当好。https://www.cnblogs.com/crackpotisback/p/5545708.html原创 2018-09-26 19:57:20 · 129 阅读 · 0 评论 -
随机森林算法总结
集成学习的概念集成学习简单来说就是通过构建并结合多个学习器来完成学习任务。集成学习的一般结构是先产生一组“个体学习器”,在通过一定的策略把它们结合起来结构如下图所示:集成学习能够通过将多个学习器结合起来,常可获得比单一学习器显著优越的泛化能力,对‘弱分类器‘(常指分化能力略优于随机猜测的学习器)尤为明显,因此集成学习的很多理论研究都是针对弱学习器进行的,而基学习器有时直接成为是弱分类器。...原创 2019-01-27 01:29:34 · 5813 阅读 · 0 评论 -
GDBT
CART决策树有两种类型:分类树和回归树,其中分类树输出是样本的类别,回归树输出的是连续的实数。CART(Classification And Regression Tree)既可以做分类也可以做回归。CART是在给定输入随机变量X的条件下输出随机变量Y的条件概率分布学习方法。CART书假设决策树是二叉树,内部节点的取值为‘是’和‘否’,这样的决策树等价于递归的二分每一个特征,将输出空间即特征...原创 2019-01-29 18:48:46 · 1235 阅读 · 0 评论 -
达观杯文本处理比赛(一)
初试数据:数据包含2个csv文件:train_set.csv:此数据集用于训练模型,每一行对应一篇文章。文章分别在“字”和“词”的级别上做了脱敏处理。共有四列:第一列是文章的索引(id),第二列是文章正文在“字”级别上的表示,即字符相隔正文(article);第三列是在“词”级别上的表示,即词语相隔正文(word_seg);第四列是这篇文章的标注(class)。注:每一个数字对应...原创 2019-03-01 16:29:33 · 377 阅读 · 0 评论 -
哑编码和独热编码
请看这篇文章,个人感觉写的很好原创 2019-03-27 17:38:41 · 2951 阅读 · 0 评论