强化学习
嘿喵井长
民之从事也 常于几成而败之 不慎终也 慎终如始 则无败事
展开
-
基于RL的拥塞控制算法Orca
项目源码Orca Orca v1.0 本版本提供了论文“经典与现代:基于实用学习的互联网拥塞控制”中的源代码和实验材料。 安装指南 安装所需工具 安装Mahimahi sudo apt-get install build-essential git debhelper autotools-dev dh-autoreconf iptables protobuf-compiler libprotobuf-dev pkg-config libssl-dev dnsmasq-base ssl-cert libxcb翻译 2020-11-30 21:43:27 · 1162 阅读 · 2 评论 -
什么是强化学习?
强化学习是机器学习大家族中的一大类, 使用强化学习能够让机器学着如何在环境中拿到高分, 表现出优秀的成绩. 而这些成绩背后却是他所付出的辛苦劳动, 不断的试错, 不断地尝试, 累积经验, 学习经验.也就是说强化学习是一个不断试错的过程。 从无到有 强化学习是一类算法, 是让计算机实现从一开始什么都不懂, 脑袋里没有一点想法, 通过不断地尝试, 从错误中学习, 最后找到规律, 学会了达到目的的方法. 这就是一个完整的强化学习过程. 实际中的强化学习例子有很多. 比如近期最有名的 Alpha go, 机器头一转载 2020-11-11 11:54:42 · 677 阅读 · 0 评论