- 博客(4)
- 收藏
- 关注
转载 逻辑斯蒂回归中特征共线性或强相关的影响
https://blog.csdn.net/lipengcn/article/details/82467082 粘贴增加一部分解释:设想建立一个具有两变量X1和X2的线性模型,假设真实模型是Y=X1+X2。理想地,如果观测数据含有少量噪声,线性回归解决方案将会恢复真实模型。然而,如果X1和X2线性相关(大多数优化算法所关心的),Y=2*X1, Y=3*X1-X2或Y=100*X1-99...
2018-11-20 00:57:26 944
转载 随机森林调节参数
原文https://www.jianshu.com/p/27b2ef36a182这里简要介绍下这个题目的注意事项:多分类。为每个类输出相应类的概率 评估的时候使用的是multi-class log loss特征工程无疑,当前使用的是最原始的特征。我们并未对特征进行一定的调整,而是粗暴的直接拿来使用。目前特征分成以下几类:时间类,包括月份、天、时、具体星期几 地址类,包括经...
2018-11-06 23:34:13 6413
转载 Python机器学习包的sklearn中的Gridsearch简单使用
原文链接:https://blog.csdn.net/selous/article/details/70229180cross-validation(交叉验证)A solution to this problem is a procedure called cross-validation (CV for short). A test set should still be held ou...
2018-11-06 22:39:23 760
转载 如何在 Kaggle 首战中进入前 10%
链接https://www.colabug.com/3536216.html Kaggle 是目前最大的 Data Scientist 聚集地。很多公司会拿出自家的数据并提供奖金,在 Kaggle 上组织数据竞赛。我最近完成了第一次比赛, 在 2125 个参赛队伍中排名第 98 位(~ 5%) 。因为是第一次参赛,所以对这个成绩我已经很满意了。在 Kaggle 上一次比赛的结果除了排名以外,还...
2018-11-06 22:27:33 292
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人