机器学习

Python3从无到机器学习

一个框架解决几乎所有机器学习问题

深入浅出--梯度下降法及其实现

使用sklearn进行集成学习——理论

使用sklearn进行集成学习——实践

使用sklearn进行PCA学习

 

XGBoost——机器学习(理论+图解+安装方法+python代码)

xgboost的原理没你想像的那么难

XGBoost参数调优完全指南(附Python代码)

LightGBM,XGBoost被面试官刁难了?内有含泪面试经验

 

调参

如何选择神经网络的超参数

Github开源项目hyperopt系列的中文文档,以及学习教程

如何使用hyperopt对xgboost进行自动调参

BTB自动调参

特征选择

集成学习综合教程

维数灾难

数据降维算法-从PCA到LargeVis

热门数据挖掘模型应用入门(一): LASSO 回归

1.当分类型变量没有太多值时,做one-hot encoding可提升表现。(注:数据预处理时谨慎使用)
2.检查树的数量是否造成了过拟合或欠拟合。可分析测试集上的metric value(度量值),来选择合适的迭代次3.数调整学习率。若训练时,上次迭代没有过拟合,则提高学习率。若检测到过拟合,则降低学习率。
4.树深度。通常最佳的树深度在4-10之间,推荐使用6-10之间的值。
5.L2正则化,尝试不同值以找到最佳值。
6.随机强度,尝试不同值已找到最佳值。
7.Bagging温度
8.Border count,这个值会影响GPU训练速度。值越小,训练越快。对大部分数据集而言,设置为128就行了
9.若数据集是有序的,调整internal dataset order。

作者:R2ai帮助创造AI的AI
链接:https://www.zhihu.com/question/302880510/answer/545842110
来源:知乎

自定义损失函数 度量函数

高级调参技巧

2018中国高校计算机大数据挑战赛-快手活跃用户预测

pyecharts交互式可视化训练,适合入门、进阶和提高

 

注意力机制

数据挖掘中常见的「异常检测」算法有哪些?

时间序列基础及常用算法笔记

 

构建深度神经网络,我有20条「不成熟」的小建议

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值