从python零基础开始搭建强化学习环境(以及各软件安装)

本文介绍了新手如何从安装PyCharm和Python开始,强调了版本兼容性,分享了初步代码测试、使用Anaconda管理和安装Python库、PyTorch的GPU安装,以及强化学习环境配置的过程。
摘要由CSDN通过智能技术生成

一、pycharm安装

由于我是纯新手,很多都搞不太懂,所以从安装开始学起,首先是要按照pycharm以及python,pycharm是运行python的一个软件,很有必要安装。PyCharm 是我知道的python编辑器中,比较顺手的一个。

这两者也是有版本对应的。(打个比方,你下载了pycharm的2021.1版本,但是你python是3.11,那是运行不了的,会有很多报错。)

而关于两者的具体安装过程,我是学习了这个教程:pycharm安装教程

二、初步测试代码

都安装好之后,可以网上找点代码初步进行实验,这里我是找了个画圆的代码,然后在pycharm创建好文档后,需要看一下你所找的代码都用了那些库,然后把这些库安装好,安装方式是:文件—设置—项目—python解释器,然后搜索对应的库点击安装即可,这样代码就能正常运行了。

(如果觉得库太少了,可以下载个整理库的软件Anaconda,还可以用他创建不同环境,具体方法和理解可以看这篇:Python、PyCharm和Anaconda的关系

import numpy as np
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
# ==========================================
# 圆的基本信息
# 1.圆半径
r = 2.0
# 2.圆心坐标
a, b = (0., 0.)
# ==========================================
# 方法一:参数方程
theta = np.arange(0, 2 * np.pi, 0.01)
x = a + r * np.cos(theta)
y = b + r * np.sin(theta)
fig = plt.figure()
axes = fig.add_subplot(111)
axes.plot(x, y)
axes.axis('equal')
plt.title('圆形绘制1')
plt.show()

三、PyTorch的安装

测试没问题后,若需要进行神经网络模型类的训练,最好是加一个框架,而现在最好的应该就是PyTorch(说白了,就是搞神经网络就要下载它)。

PyTorch 是一个开源的深度学习框架,提供了丰富的工具和库,用于构建和训练各种深度神经网络模型,帮助用户更高效地进行深度学习任务。

PyTorch是分两个版本的,一般都下载gpu版本,这是我找的两者区别:

GPU 版本:PyTorch 的 GPU 版本利用 NVIDIA 的 CUDA 平台,加速深度学习模型的训练和推断。GPU 版本的 PyTorch 需要安装正确版本的 NVIDIA 显卡驱动和 CUDA 工具包。GPU 版本可以显著加快大规模神经网络模型的训练速度,特别是对于深层、复杂的模型或者大规模数据集。

CPU 版本:PyTorch 的 CPU 版本可以在几乎所有支持 C++ 编译器的计算设备上运行,包括各种CPU架构、移动设备和嵌入式系统等。相比于GPU版本,PyTorch 的CPU版本在进行大规模的深度学习模型训练时通常表现出较低的计算性能。

而下载gpu版本就需要提前安装好CUDA,整个过程都可以看这篇文章,很简洁:在Pycharm中搭建Pytorch,CUDA

之后找一个强化学习类的代码运行,一开始肯定会报错,看看缺什么库就去下载什么库,然后再看看有没有进位错误,都没有的话,一般是可以运行成功的,我就是到这里成功的。

四、个人简单总结

1.先安装pycharm和python。

2.再下个管理库的Anaconda。

(如果不跑强化学习或者不使用神经网络的话,到此就能用python了,缺什么库用pip install 库名  ,这个指令去安装即可。)

3.安装cuda。先看一下自己的nvidia版本,去该网站挑选cuda的版本并下载:https://developer.nvidia.com/cuda-toolkit-archive(可以打开nvidia控制面板-系统信息-组件,这样就可以看到本电脑可以安装cuda的最大版本号,只要不超过这个版本就行,但我们一般选择版本是要根据pytorch 版本结合选择。进入pytorch官网:https://pytorch.org/get-started/locally/#supported-windows-distributions,可以看到,我的电脑支持的最大版本就是CUDA12.1,且要注意python版本不能小于3.8)

4.安装完成后,可用下方的三句代码验证cuda是否安装成功,是否可用,如果结果为ture,则可用。

import torch
print(torch.__version__)
print(torch.cuda.is_available())

若cuda安装成功但是print(torch.cuda.is_available())却输出为false的原因有二:
①版本号不匹配
②pytorch不小心安装为cpu版,与cuda适配的pytorch应该为gpu版本。
5.配置环境

可以在Anaconda创建一个环境,然后运行四段代码。至于怎么创建,具体在第二部分的链接有。

python -m pip install --upgrade pip
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pandas
pip install gym==0.25.2
pip install pyglet

最后安装pytorch时,去官网:pytorch.org ,就像我上面选择的一样,选你需要的,然后在环境里运行下面那一行代码就行,之后去pycharm运行自己的代码时,看看缺什么库,就用 pip install 库名  ,安装即可。

(第一次尝试,教程肯定有不完善的地方,有问题随时提问,有错必改。)

  • 25
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
搭建强化学习环境需要安装以下软件和库: 1. Python 3.6 或以上版本 2. Gym:一个强化学习环境库 3. NumPy:一个数学计算库 4. Matplotlib:一个绘图库 5. TensorFlow 或 PyTorch:深度学习框架 以下是搭建强化学习环境的步骤: 1. 安装 Python,建议安装 Anaconda 发行版,它包含了许多科学计算库,并且可以方便地管理 Python 环境。 2. 安装 Gym,在终端中输入以下命令: ``` pip install gym ``` 3. 安装 NumPy 和 Matplotlib,在终端中输入以下命令: ``` pip install numpy pip install matplotlib ``` 4. 安装 TensorFlow 或 PyTorch。如果你选择使用 TensorFlow,可以在终端中输入以下命令: ``` pip install tensorflow ``` 如果你选择使用 PyTorch,可以在终端中输入以下命令: ``` pip install torch torchvision ``` 5. 搭建完成后,你可以在 Python 中引入库并开始编写强化学习算法了。例如,在 Python 中引入 Gym 和 NumPy: ```python import gym import numpy as np ``` 6. 你可以从 Gym 中选择一个环境并开始训练强化学习模型。例如,使用 CartPole 环境: ```python env = gym.make('CartPole-v0') state = env.reset() for t in range(1000): action = np.random.randint(0, 2) state, reward, done, info = env.step(action) env.render() if done: break ``` 这段代码将随机选择动作并在 CartPole 环境中运行,直到达到最大步数或者失败。最后,你可以在终端中关闭环境: ```python env.close() ``` 希望这些步骤能够帮助你搭建强化学习环境,并开始编写强化学习算法。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值