自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 【强化学习】DDPG 算法实现案例

问题描述与Demo介绍 完整代码: 如果觉得不错,麻烦点颗星哦! 1.Demo介绍 在该demo中,我们将利用DDPG算法,使一个机械臂学会自己变换角度去抓“方块”,如下图,机械臂从最开始完全不知道如何去捕捉方块,到最后,每次都能精准的抓住方块。 2.算法介绍 其实理解 Deep Determi...

2019-06-25 16:37:21

阅读数 1250

评论数 0

原创 【强化学习】Policy Gradient 算法实现案例

【强化学习】Policy Gradient算法详解 1.算法思想 之前的文章已经介绍了Q-Learning的相关知识及其实例:【强化学习】Q-Learning 迷宫算法案例 Q-Learning 是一个基于价值value的方法,通过计算动作得分来决策的,它在确定了价值函数的基础上采用某种策略(贪婪...

2019-06-12 10:45:07

阅读数 363

评论数 0

原创 【强化学习】Q-Learning 迷宫算法案例

问题描述与项目流程 1.问题描述 在该项目中,你将使用强化学习算法(本文使用的Q-Learning),实现一个自动走迷宫的机器人。 如上图所示,机器人初始位置在地图左上角。在我们的迷宫中,有墙壁(黑色方块)、炸弹(黄色圆块)及终点(绿色方块)。机器人要尽可能避开陷阱,并且拿到黄金后,以最少的步...

2019-05-29 17:02:15

阅读数 926

评论数 0

原创 VGG(Pytorch实现)

VGG简介 论文:VGG原文(可直接下载,可能加载较慢,稍等即可) 1.背景介绍 VGG模型是2014年ILSVRC竞赛的第二名,第一名是GoogLeNet。但是VGG模型在多个迁移学习任务中的表现要优于googLeNet。而且,从图像中提取CNN特征,VGG模型是首选算法。它的缺点在于,参...

2018-12-18 20:34:50

阅读数 2486

评论数 2

原创 PyTorch实战:AlexNet

本文是日常学习总结,内容均为原创,未经博主允许不得转载。 AlexNet简介 论文:AlexNet原文(可能加载较慢,稍等即可) 1.背景介绍 AlexNet由Alex Krizhevsky于2012年提出,夺得2012年ILSVRC比赛的冠军,top5预测的错误率为16.4%,它以领...

2018-12-18 11:08:06

阅读数 2793

评论数 9

原创 Pytorch:LeNet

Pytorch:LeNet(Mnist数据集) 一、实验环境: Python 3.6 Pytorch 0.4.0 torchvision 0.2.1 二、Mnist说明: MNIST 数据集来自美国国家标准与技术研究所, National Institute of Standards a...

2018-12-12 16:28:31

阅读数 2229

评论数 8

原创 机器学习入门-logistic回归和softmax回归

刚学完吴恩达-<deep learning>-第一课第二周,自己总结一下其中比较重要的知识点,作为日常总结和学习记录: logistic回归和softmax回归放在一起总结一下,其实softmax就是logistic的推广,logistic一般用于二分类,而softm...

2018-06-13 11:55:35

阅读数 737

评论数 1

原创 【强化学习】

To create a team of threads #pragma omp parallel To share work between threads: #pragma omp for #pragma omp single To prevent conflicts (prevent ...

2019-06-26 15:42:33

阅读数 20

评论数 0

原创 【openMP并行计算】计算π

Linux环境对OpenMP的支持: 在Linux上编译和运行OpenMP程序 编译OpenMP程序: gcc -fopenmp a.c 运行OpenMP程序: ./a.out 1. 串行计算π #include <stdio.h> #include <omp.h> sta...

2019-06-26 14:46:11

阅读数 145

评论数 0

提示
确定要删除当前文章?
取消 删除