2018年11月_海晨威

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创强化学习适合解决什么样的问题

问：强化学习解决的是什么样的问题？答：“序列决策问题。”面试官又问：“多臂老虎机只是一步，没有序列呀？”…上述问题和回答参考自：再励学习面试真题无论是在面试中，还是在实际的业务中，强化学习能够解决的问题、适合解决的问题都需要理解的非常深刻。在上面提及的问题中，多臂老虎机其实可以看作一种特殊的强化学习问题：序列长度一直为1的强化学习。它在强化学习关键的三要素（状态，动作，奖惩）中，没有状...

2018-11-24 21:23:53 6823

GBDT 及其改进版本（XGboost, lightGBM）在数据竞赛中占了大半江山，网上讲解的文章也很多，但大多是文字和公式的形式，这里尝试用简单的图解形式，去理解 GBDT 的基本操作过程。参考《统计学习方法》P149中的例子，说明 GBDT 的构造和预测过程。GBDT的构造GBDT 采用的弱分类器限定了 CART，因此构造出来的都是二叉树，因为单棵 CART 树的能力有限，GBDT 通...

2018-11-03 16:36:45 6925

原创 python绘制带误差线的条形图

绘制格式：plt.bar(index, values, yerr = std, error_kw = {'ecolor' : '0.2', 'capsize' :6}, alpha=0.7)yerr关键字参数：可传入包含标准差的列表error_kw={} , 接收显示误差线的关键字函数eColor：指定误差线的颜色capsize ：指定误差线两头横线的宽度alpha：控制彩色条状图的...

2018-11-01 19:31:26 14267 1

原创决策树知识思考

1、决策树的模型策略和算法模型：决策树的学习本质上就是从训练数据集中归纳出一组分类规则，使它与训练数据矛盾较小的同时具有较强的泛化能力。从另一个角度看，学习也是基于训练数据集估计条件概率模型。策略：决策树的损失函数通常是正则化的极大似然函数，学习的策略是以损失函数为目标函数的最小化。算法：由于这个最小化问题是一个NP完全问题，现实中，我们通常采用启发式算法来近似求解这一最优化问题，因此得到的...

2018-11-01 19:25:44 777

绝对可行的PRM路径规划matlab代码

绝对能运行的matlab路径规划PRM代码，该代码给出了二维环境下，机器人的路径规划方法——概率路图法（PRM），并附有文档简单说明

2018-05-26

在学习和使用 Python 的过程中，你认为有哪些较难掌握的知识点？

2020-12-26

数模问题，大虾快帮帮忙

2015-06-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 强化学习适合解决什么样的问题

原创 图解GBDT的构造和预测过程