- 博客(4)
- 资源 (1)
- 问答 (2)
- 收藏
- 关注
原创 强化学习适合解决什么样的问题
问:强化学习解决的是什么样的问题?答:“序列决策问题。”面试官又问:“多臂老虎机只是一步,没有序列呀?”…上述问题和回答参考自:再励学习面试真题无论是在面试中,还是在实际的业务中,强化学习能够解决的问题、适合解决的问题都需要理解的非常深刻。在上面提及的问题中,多臂老虎机其实可以看作一种特殊的强化学习问题:序列长度一直为1的强化学习。它在强化学习关键的三要素(状态,动作,奖惩)中,没有状...
2018-11-24 21:23:53 6823
原创 图解GBDT的构造和预测过程
GBDT 及其改进版本(XGboost, lightGBM)在数据竞赛中占了大半江山,网上讲解的文章也很多,但大多是文字和公式的形式,这里尝试用简单的图解形式,去理解 GBDT 的基本操作过程。参考《统计学习方法》P149中的例子,说明 GBDT 的构造和预测过程。GBDT的构造GBDT 采用的弱分类器限定了 CART,因此构造出来的都是二叉树,因为单棵 CART 树的能力有限,GBDT 通...
2018-11-03 16:36:45 6925
原创 python绘制带误差线的条形图
绘制格式:plt.bar(index, values, yerr = std, error_kw = {'ecolor' : '0.2', 'capsize' :6}, alpha=0.7)yerr关键字参数:可传入包含标准差的列表error_kw={} , 接收显示误差线的关键字函数eColor:指定误差线的颜色capsize :指定误差线两头横线的宽度alpha:控制彩色条状图的...
2018-11-01 19:31:26 14267 1
原创 决策树知识思考
1、决策树的模型策略和算法模型:决策树的学习本质上就是从训练数据集中归纳出一组分类规则,使它与训练数据矛盾较小的同时具有较强的泛化能力。从另一个角度看,学习也是基于训练数据集估计条件概率模型。策略:决策树的损失函数通常是正则化的极大似然函数,学习的策略是以损失函数为目标函数的最小化。算法:由于这个最小化问题是一个NP完全问题,现实中,我们通常采用启发式算法来近似求解这一最优化问题,因此得到的...
2018-11-01 19:25:44 777
在学习和使用 Python 的过程中,你认为有哪些较难掌握的知识点 ?
2020-12-26
数模问题,大虾快帮帮忙
2015-06-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人