机器学习
机器学习
sosososoon
这个作者很懒,什么都没留下…
展开
-
强化学习——Deep Deterministic Policy Gradient
Deep Deterministic Policy Gradient原创 2020-11-07 20:45:21 · 2085 阅读 · 0 评论 -
强化学习——Sparse Reward and Imitation Learning
Sparse RewardImitation Learning原创 2020-11-05 16:13:41 · 574 阅读 · 0 评论 -
强化学习——DQN 算法与Actor-Critic
DQN 算法原创 2020-11-03 22:42:49 · 2712 阅读 · 0 评论 -
强化学习——策略梯度及 PPO 算法
强化学习—策略梯度及 PPO 算法原创 2020-10-29 15:37:48 · 3309 阅读 · 1 评论 -
强化学习——马尔可夫决策过程及表格型方法
马尔可夫决策过程及表格型方法手打更新中,请稍后刷新原创 2020-10-23 18:52:10 · 387 阅读 · 0 评论 -
强化学习——基础知识
原创 2020-10-20 22:23:08 · 228 阅读 · 0 评论 -
Logistic Regression 逻辑回归
Logistic Regression 逻辑回归线性回归模型假设变量xix_ixi有ddd个属性,即xi=(xi1,xi2,...,xid)Tx_i=(x_{i1},x_{i2},...,x_{id})^Txi=(xi1,xi2,...,xid)T,线性回归模型的任务就是试图学得一个通过属性的线性组合来进行预测的函数,即f(xi)=w1xi1+w2xi2+...+wdxid+b,f(x_i) = w_1x_{i1}+w_2x_{i2}+...+w_dx_{id}+b,f(xi)=w1xi原创 2020-08-12 15:06:44 · 337 阅读 · 0 评论