机器学习
文章平均质量分 78
玉泽天成
这个作者很懒,什么都没留下…
展开
-
机器学习中的算法(1)-决策树模型组合之随机森林与GBDT
前言: 决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。 模型组合(比如说有Boosting,Bagging等)与决策树相关的算法比较多,这些算法最终的结果转载 2013-06-06 15:01:38 · 1034 阅读 · 0 评论 -
机器学习开源包
收集的机器学习开源包,逐步补充: PyMining-开源中文文本数据挖掘平台 http://code.google.com/p/python-data-mining-platform/原创 2013-06-06 15:06:17 · 466 阅读 · 0 评论 -
中文分词资料
1,ictcas 包括Java,LinuxC, WindowsC 的版本均在 http://w http:// ww.ictclas.org/index.html 有下载。 2,imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,作者高小平,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研原创 2013-06-17 15:19:03 · 1609 阅读 · 0 评论