数据挖掘
newstrongers
毕己力,做研究
展开
-
scikit-learn 中的随机森林用法
随机森林是一种以决策树为基分类器的常用集成分类器,使用取平均方法组合基分类器来预测样本类别。在Python的机器学习包scikit-learn中已经有具体实现。下面给出使用方法from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier(n_estimators=10) model.fit原创 2017-06-18 17:36:19 · 1399 阅读 · 0 评论 -
数据科学的未来
数据科学的未来From: Kirk Borne数据科学的发展日新月异,正深入我们生活的方方面面。数据科学改变了我们探索世界,与世界交互的方式,而且数据科学的算法和应用也在持续发展。我们期待这一趋势继续,因为数据科学对人类产生了日益深刻的影响。在这里我们描述的是数据科学领域中我们参与的未来几年即将出现的一些趋势与应用。翻译 2017-07-01 11:05:08 · 1205 阅读 · 0 评论 -
机器学习中的正则化
机器学习中的正则化正则化(regularization)是机器学习中进行模型选择的典型方法。正则化是模型损失函数结构风险最小化策略的实现,是在经验风险上加一个正则化项(regularized item)或罚项(penalty term)。正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。比如,正则化项可以是模型参数向量的范数。原创 2017-06-14 22:20:56 · 670 阅读 · 0 评论