【笔记】深度强化学习-课程环境配置

深度强化学习-课程环境配置

  • 使用工具
    Anaconda + Visual Studio Code
    Python + PyTorch
  • 电脑配置
    HP Pavilion Laptop Model 15-cw1001AU
    CPU: AMD Ryzen 3 3300U with Radeon Vega Mobile Gfx 2.10 GHz
    GPU: AMD Radeon™ Vega 6 集成显卡
    RAM: 16.0 GB

课程大纲

  • 神经网络和梯度下降
  • 强化学习基础(PyTorch)
  • 基于值函数的方法(Q-Learning,Rainbow)
  • 基于策略函数的方法(Policy-based Method)

环境配置

配置新环境

在Anaconda CMD Prompt 中创建新的环境,名为env_AI,随后工作在其中展开

 conda create --name env_AI python=3.10

python=3.10 :根据pytorch适配情况搭配Python环境

等待弹出待安装的库后,输入"y"后回车。

安装完成后,激活新的库

conda activate env_AI
  • 可以通过conda env list查看已安装的环境的名字和位置
在激活的环境下查看现在已经安装的库
> conda list
bzip2                     1.0.8                h2bbff1b_5
ca-certificates           2023.12.12           haa95532_0
libffi                    3.4.4                hd77b12b_0
openssl                   3.0.13               h2bbff1b_0
pip                       23.3.1          py310haa95532_0
python                    3.10.13              he1021f5_0
setuptools                68.2.2          py310haa95532_0
sqlite                    3.41.2               h2bbff1b_0
tk                        8.6.12               h2bbff1b_0
tzdata                    2024a                h04d1e81_0
vc                        14.2                 h21ff451_1
vs2015_runtime            14.27.29016          h5e58377_2
wheel                     0.41.2          py310haa95532_0
xz                        5.4.6                h8cc25b3_0
zlib                      1.2.13               h8cc25b3_0
补全所需的一些库

建议选取网速较好,流量充足的地方配置,需要下载约1G的库。

  • pytorch
    在官网上查看得到,选取最新版本的PyTorch,考虑到我的电脑是AMD的集显,选取只用CPU的版本。对于实际情况,结合官网建议,选取适合自己电脑显卡(CPU)的Torch版本。

⇒ 继续在Prompt里面通过conda配置环境。

# CPU Only
conda install pytorch==2.2.0 torchvision==0.17.0 torchaudio==2.2.0 cpuonly -c pytorch
  • pandas: 数据处理
pip install pandas
  • numpy:数学计算和矩阵等计算
pip install numpy
  • scipy:数学计算
pip install scipy
  • matplotlib:科研绘图
pip install matplotlib

通常pandas + PyTorch 能一次性装完所有需要的包

  • seaborn:画图的
pip install seaborn
  • scikit-learn:成套的机器学习包,很方便直接用。
pip install -U scikit-learn
  • ipykernel:为了能够愉快地使用交互式的Jupyter,要装。
conda install -n env_AI ipykernel --update-deps --force-reinstall

这个是VS Code 自动安装没成功,强制重新安装的指令

  • 确认最终安装成功的列表
conda list
或
pip list
>
# packages in environment at F:\anaconda3\envs\env_AI:
#
# Name                    Version                   Build  Channel
asttokens                 2.0.5              pyhd3eb1b0_0
blas                      1.0                         mkl
brotli-python             1.0.9           py310hd77b12b_7
bzip2                     1.0.8                h2bbff1b_5
ca-certificates           2023.12.12           haa95532_0
certifi                   2024.2.2        py310haa95532_0
charset-normalizer        2.0.4              pyhd3eb1b0_0
colorama                  0.4.6           py310haa95532_0
comm                      0.1.2           py310haa95532_0
contourpy                 1.2.0                    pypi_0    pypi
cpuonly                   2.0                           0    pytorch
cycler                    0.12.1                   pypi_0    pypi
debugpy                   1.6.7           py310hd77b12b_0
decorator                 5.1.1              pyhd3eb1b0_0
exceptiongroup            1.2.0           py310haa95532_0
executing                 0.8.3              pyhd3eb1b0_0
filelock                  3.13.1          py310haa95532_0
fonttools                 4.49.0                   pypi_0    pypi
freetype                  2.12.1               ha860e81_0
gmpy2                     2.1.2           py310h7f96b67_0
idna                      3.4             py310haa95532_0
intel-openmp              2023.1.0         h59b6b97_46320
ipykernel                 6.28.0          py310haa95532_0
ipython                   8.20.0          py310haa95532_0
jedi                      0.18.1          py310haa95532_1
jinja2                    3.1.3           py310haa95532_0
joblib                    1.3.2                    pypi_0    pypi
jpeg                      9e                   h2bbff1b_1
jupyter_client            8.6.0           py310haa95532_0
jupyter_core              5.5.0           py310haa95532_0
kiwisolver                1.4.5                    pypi_0    pypi
lerc                      3.0                  hd77b12b_0
libdeflate                1.17                 h2bbff1b_1
libffi                    3.4.4                hd77b12b_0
libjpeg-turbo             2.0.0                h196d8e1_0
libpng                    1.6.39               h8cc25b3_0
libsodium                 1.0.18               h62dcd97_0
libtiff                   4.5.1                hd77b12b_0
libuv                     1.44.2               h2bbff1b_0
libwebp-base              1.3.2                h2bbff1b_0
lz4-c                     1.9.4                h2bbff1b_0
markupsafe                2.1.3           py310h2bbff1b_0
matplotlib                3.8.3                    pypi_0    pypi
matplotlib-inline         0.1.6           py310haa95532_0
mkl                       2023.1.0         h6b88ed4_46358
mkl-service               2.4.0           py310h2bbff1b_1
mkl_fft                   1.3.8           py310h2bbff1b_0
mkl_random                1.2.4           py310h59b6b97_0
mpc                       1.1.0                h7edee0f_1
mpfr                      4.0.2                h62dcd97_1
mpir                      3.0.0                hec2e145_1
mpmath                    1.3.0           py310haa95532_0
nest-asyncio              1.6.0           py310haa95532_0
networkx                  3.1             py310haa95532_0
numpy                     1.26.4          py310h055cbcc_0
numpy-base                1.26.4          py310h65a83cf_0
openjpeg                  2.4.0                h4fc8c34_0
openssl                   3.0.13               h2bbff1b_0
packaging                 23.2                     pypi_0    pypi
pandas                    2.2.1                    pypi_0    pypi
parso                     0.8.3              pyhd3eb1b0_0
pillow                    10.2.0          py310h2bbff1b_0
pip                       23.3.1          py310haa95532_0
platformdirs              3.10.0          py310haa95532_0
prompt-toolkit            3.0.43          py310haa95532_0
prompt_toolkit            3.0.43               hd3eb1b0_0
psutil                    5.9.0           py310h2bbff1b_0
pure_eval                 0.2.2              pyhd3eb1b0_0
pygments                  2.15.1          py310haa95532_1
pyparsing                 3.1.1                    pypi_0    pypi
pysocks                   1.7.1           py310haa95532_0
python                    3.10.13              he1021f5_0
python-dateutil           2.8.2              pyhd3eb1b0_0
pytorch                   2.2.0              py3.10_cpu_0    pytorch
pytorch-mutex             1.0                         cpu    pytorch
pytz                      2024.1                   pypi_0    pypi
pywin32                   305             py310h2bbff1b_0
pyyaml                    6.0.1           py310h2bbff1b_0
pyzmq                     25.1.2          py310hd77b12b_0
requests                  2.31.0          py310haa95532_1
scikit-learn              1.4.1.post1              pypi_0    pypi
scipy                     1.12.0                   pypi_0    pypi
seaborn                   0.13.2                   pypi_0    pypi
setuptools                68.2.2          py310haa95532_0
six                       1.16.0             pyhd3eb1b0_1
sqlite                    3.41.2               h2bbff1b_0
stack_data                0.2.0              pyhd3eb1b0_0
sympy                     1.12            py310haa95532_0
tbb                       2021.8.0             h59b6b97_0
threadpoolctl             3.3.0                    pypi_0    pypi
tk                        8.6.12               h2bbff1b_0
torchaudio                2.2.0                 py310_cpu    pytorch
torchvision               0.17.0                py310_cpu    pytorch
tornado                   6.3.3           py310h2bbff1b_0
traitlets                 5.7.1           py310haa95532_0
typing_extensions         4.9.0           py310haa95532_1
tzdata                    2024.1                   pypi_0    pypi
urllib3                   2.1.0           py310haa95532_1
vc                        14.2                 h21ff451_1
vs2015_runtime            14.27.29016          h5e58377_2
wcwidth                   0.2.5              pyhd3eb1b0_0
wheel                     0.41.2          py310haa95532_0
win_inet_pton             1.1.0           py310haa95532_0
xz                        5.4.6                h8cc25b3_0
yaml                      0.2.5                he774522_0
zeromq                    4.3.5                hd77b12b_0
zlib                      1.2.13               h8cc25b3_0
zstd                      1.5.5                hd43e919_0

2024-03-07
end

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值