![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
人工智能笔记
文章平均质量分 70
人工智能相关领域笔记
Oxalate-c
总结流技术小白
展开
-
SAC (Soft Actor-Critic)-spinning up实战详解
SAC (Soft Actor-Critic)算法在spinning up上的实践原创 2023-05-13 16:24:58 · 900 阅读 · 0 评论 -
GTX1080 + python 3.8 + pytorch 1.12 + cuda 11.6环境配置
搞了台二手机器,有张GTX1080的显卡,虽然也比较拉跨,但是比之前的纯cpu训练可能要给力点,所以配置了下环境,记录下一些关键过程。要注意在所有安装之前,原创 2023-05-03 15:47:21 · 1835 阅读 · 1 评论 -
CartPole 强化学习详解2 - Policy Gradient
也叫Reinforce算法,原始实现:examples/reinforce.py at main · pytorch/examples · GitHub参考代码:https://github.com/MorvanZhou/Reinforcement-learning-with-tensorflow/blob/master/contents/7_Policy_gradient_softmax/RL_brain.py1. 基本原理强化学习 # Policy gradient_真·skysys的博原创 2022-05-09 22:57:48 · 866 阅读 · 0 评论 -
AI领域基本语法笔记
1. Numpy1.1 np.hstack & np.vstacknp.hstack: horizontal,横向组合数组,往右排 np.vstack: vertical,纵向组合数组,往下排numpy中的hstack()、vstack()、stack()、concatenate()函数详解 - 云+社区 - 腾讯云1.2 np.random提供了各种随机数的函数,涵盖整型、浮点型、指定值域、多维随机。详见:NumPy – np.random的使用 – X.YU有些函原创 2022-05-04 10:20:30 · 235 阅读 · 0 评论 -
CartPole 强化学习详解1 - DQN
工作中常会接触到强化学习的内容,自己以gym环境中的Cartpole为例动手实现一下,记录点实现细节。1. gym-CartPole环境准备环境是用的gym中的CartPole-v1,就是火柴棒倒立摆。gym是openai的开源资源,具体如何安装可参照:强化学习一、基本原理与gym的使用_wshzd的博客-CSDN博客_gym 强化学习这个环境的具体细节(参考gym源码cartpole.py):action只有向左向右两个选择,离散量观测值有4个,x, x_dot, thet原创 2022-05-03 21:07:51 · 8685 阅读 · 13 评论 -
AI算力扫盲
1. 基本概念:OPS(Operations Per Second):处理器运算能力单位, 1TOPS(Tera):每秒钟可进行10^12操作; 1GOPS(Giga):每秒钟可进行10^9操作; 1MOPS(Million):每秒钟可进行10^6操作; FLOPS FLOPs2. 参考:https://zhuanlan.zhihu.com/p/337618803...原创 2021-07-02 17:12:44 · 6245 阅读 · 0 评论 -
再学李宏毅-1-机器学习能做什么?大家都在做什么
人工智能能做到哪些工作,李老师已经在课程介绍了讲的比较清楚了。以此为基础,给出该领域一些主要工作想要解决的问题和方法,持续更新。原创 2021-01-17 22:19:44 · 177 阅读 · 1 评论 -
人工智能基本词汇 & 术语
Regression:回归。原指分析不同组随机变量之间的(如X(x1, ... xn)和 Y(y1, .... yn))统计分析方法,是一种建模方法Logistic Regression:逻辑回归。是线性回归的一种推广,从功能角度来说常用于分析分类问题;从数学模型角度来说,因变量会多多一次非线性变换,将因变量映射成分类概率。...原创 2021-01-17 10:28:05 · 480 阅读 · 0 评论