数据挖掘
JeemyJohn
这个作者很懒,什么都没留下…
展开
-
LightGBM大战XGBoost,谁将夺得桂冠?
0.引言 如果你是一个机器学习社区的活跃成员,你一定知道 提升机器(Boosting Machine)以及它们的能力。提升机器从AdaBoost发展到目前最流行的XGBoost。XGBoost实际上已经成为赢得在Kaggle比赛中公认的算法。这很简单,因为他极其强大。但是,如果数据量极其的大,XGBoost也需要花费很长的时间去训练。 绝大多数人可能对 Light Gradie...原创 2018-04-13 15:36:45 · 2769 阅读 · 5 评论 -
Python计算相关性
计算相关性 import numpy as np import pandas as pd # load data data = pd.read_csv('result.csv', header=0) print(data) df = data.drop(['experiment'], axis=1) # 计算不同的相关系数 corr = df.corr(method='pearson') p...原创 2018-11-14 14:35:48 · 2401 阅读 · 0 评论