自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【经典教程翻译】卡尔曼与贝叶斯滤波器:离散贝叶斯滤波器(上)

卡尔曼滤波教材系列

2023-02-22 21:22:29 377

原创 全图片带你了解 ROI【一文图解AI之CV系列】

我们将讨论论文Faster RCNN 中描述的 RoI 池化。

2023-02-07 21:18:36 1588

原创 【经典教程翻译】卡尔曼与贝叶斯滤波器:直觉理解滤波器背后的原理(下:滤波器的思考框架)

本期继续大神Roger Labbe 的 Kalman and Bayesian Filters in Python上一期 【经典教程翻译】卡尔曼与贝叶斯滤波器:直觉理解滤波器背后的原理(上),这一期介绍滤波器的一些概念,引出广义卡尔曼滤波器 g-h 滤波器的思考方式,并且通过可以实验的例子来建立 g 和 h 因子的作用。

2023-01-31 14:43:21 446

原创 初识时间序列预测神器 NeuralProphet 实战预测股票指数

初识时间序列预测神器 NeuralProphet 实战预测股票指数

2023-01-03 11:30:00 602

原创 解方程组的意义和过程 - Strang MIT 18.06 线性代数精髓 2

在本系列中,我们用彩色 Latex 笔记记录下 MIT 18.06 Gilbert Strang 教授经典的线性代数课程的精髓,部分内容也会以动画和代码的形式。后续会覆盖更多人工智能所涉及的数学基础课程:统计,优化等,欢迎大家关注和反馈。本文总结了方程组的行视角,列视角的几何意义;并回顾了解方程的两个步骤:消元和回代。内容对应于MIT 18.06 Gilbert Strang 线性代数视频课程第一,二节。本系列链接如下01 矩阵乘法的五种理解方程组两种几何解释二元方程组来看一个具体的二元

2022-02-04 17:30:00 382

原创 Pytorch Geometric 系列教程1:互动可视化Graph数据集

本公众号MyEncyclopedia定期发布AI,算法,工程,大数据交叉领域的深度和前沿文章。欢迎关注,收藏和点赞。公众号内有本文对应的配套的视频讲解。Pytorch Geometric 系列将结合 pytorch geometric 类库,从原理结合实践来讲解深度图神经网络。和前几期一样,这一系列所有环境已经为大家封装成了 docker image。预制的 image 中既包含了 pytorch 1.8 和对应的 geometric,networkx,Jubyter notebook 还有画图涉及到的 m

2021-09-26 20:10:15 1270

原创 分享精品深度强化学习讲座 Berkeley Deep RL Bootcamp 2017

Berkeley 2017年联合了DeepMind 以及 OpenAI 举办了一个大咖云集的深度强化学习训练营,是难得的前沿深度强化学习佳品,本公众号 MyEncyclopedia 用代码实现了权威教材 Sutton & Barto 第二版强化学习的基础部分之后,会大致沿着这个训练营的思路,从原理到代码逐步揭示强化深度学习面纱,并结合各种有意思的游戏环境来演示。如果没有耐心的同学可以直接跳到文末的百度云盘下载链接,内容涵盖所有视频和slide。此次训练营主讲的强化学习领域专家包括Piete

2020-11-08 17:12:38 860

原创 通过代码学Sutton强化学习1:Grid World OpenAI环境和策略评价算法

经典教材Reinforcement Learning: An Introduction 第二版由强化领域权威Richard S. Sutton 和 Andrew G. Barto 完成编写,内容深入浅出,非常适合初学者。在本篇中,引入Grid World示例,结合强化学习核心概念,并用python代码实现OpenAI Gym的模拟环境,进一步实现策略评价算法。 Grid World 问题 第四章例子4.1提出了一个简单的离散空间状态问题:Grid World,其大致意思是在4

2020-09-14 21:18:57 815

原创 从蒙特卡罗模拟,数学递推到直觉模式来思考 Leetcode 1227 飞机座位分配概率

Leetcode 1227 是一道有意思的概率题,本篇将从多个角度来讨论这道题。题目如下有 n 位乘客即将登机,飞机正好有 n 个座位。第一位乘客的票丢了,他随便选了一个座位坐下。剩下的乘客将会:如果他们自己的座位还空着,就坐到自己的座位上,当他们自己的座位被占用时,随机选择其他座位,第 n 位乘客坐在自己的座位上的概率是多少?示例 1:输入:n = 1输出:1.00000解释:第一个人只会坐在自己的位置上。示例 2:输入: n = 2输出: 0.50000解释:在第一个人

2020-09-14 21:14:59 347

原创 组合游戏系列3: 井字棋、五子棋的OpenAI Gym GUI环境

继上一篇完成了井字棋(N子棋)的minimax 最佳策略后,我们基于Pygame来创造一个图形游戏环境,可供人机和机器对弈,为后续模拟AlphaGo的自我强化学习算法做环境准备。OpenAI Gym 在强化学习领域是事实标准,我们最终封装成OpenAI Gym的接口。本篇所有代码都在github.com/MyEncyclopedia/ConnectNGym。* 第一篇: Leetcode中的Minimax 和 Alpha Beta剪枝* 第二篇: 井字棋Leetcode系列题解和Minimax最佳策略实

2020-07-28 22:09:54 1964 1

原创 组合游戏系列2: 井字棋Leetcode系列题解和Minimax最佳策略实现

继上一篇介绍了Minimax 和Alpha Beta 剪枝算法之后,本篇选择了Leetcode中的井字棋游戏题目,积累相关代码后实现井字棋游戏并扩展到五子棋和N子棋(战略井字棋),随后用Minimax和Alpha Beta剪枝算法解得小规模下N子棋的游戏结局,并分析其状态数量和每一步的最佳策略。后续篇章中,我们基于本篇代码完成一个N子棋的OpenAI Gym 图形环境,可用于人机对战或机器对战,并最终实现棋盘规模稍大的五子棋或者N子棋中的蒙特卡洛树搜索(MCTS)算法。第一篇: Leetcode中的M

2020-07-22 13:31:50 2623

原创 组合游戏系列1: Leetcode中的Minimax 和 Alpha Beta剪枝

本系列,我们来看看在一种常见的组合游戏——回合制棋盘类游戏中,如何用算法来解决问题。首先,我们会介绍并解决搜索空间较小的问题,引入经典的博弈算法和相关理论,最终实现在大搜索空间中的Deep RL近似算法。在此基础上可以理解AlphaGo的原理和工作方式。本系列的第一篇,我们介绍3个Leetcode中的零和回合制游戏,从最初的暴力解法,到动态规划最终演变成博弈论里的经典算法: minimax 以及 alpha beta 剪枝。第一篇 Leetcode中的Minimax 和 Alpha Beta剪枝

2020-07-15 14:44:56 595

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除