深度强化学习-课程环境配置
- 使用工具
Anaconda + Visual Studio Code
Python + PyTorch
- 电脑配置
HP Pavilion Laptop Model 15-cw1001AU
CPU: AMD Ryzen 3 3300U with Radeon Vega Mobile Gfx 2.10 GHz
GPU: AMD Radeon™ Vega 6 集成显卡
RAM: 16.0 GB
课程大纲
- 神经网络和梯度下降
- 强化学习基础(PyTorch)
- 基于值函数的方法(Q-Learning,Rainbow)
- 基于策略函数的方法(Policy-based Method)
环境配置
配置新环境
在Anaconda CMD Prompt 中创建新的环境,名为env_AI,随后工作在其中展开
conda create --name env_AI python=3.10
python=3.10 :根据pytorch适配情况搭配Python环境
等待弹出待安装的库后,输入"y"后回车。
安装完成后,激活新的库
conda activate env_AI
- 可以通过
conda env list
查看已安装的环境的名字和位置
在激活的环境下查看现在已经安装的库
> conda list
bzip2 1.0.8 h2bbff1b_5
ca-certificates 2023.12.12 haa95532_0
libffi 3.4.4 hd77b12b_0
openssl 3.0.13 h2bbff1b_0
pip 23.3.1 py310haa95532_0
python 3.10.13 he1021f5_0
setuptools 68.2.2 py310haa95532_0
sqlite 3.41.2 h2bbff1b_0
tk 8.6.12 h2bbff1b_0
tzdata 2024a h04d1e81_0
vc 14.2 h21ff451_1
vs2015_runtime 14.27.29016 h5e58377_2
wheel 0.41.2 py310haa95532_0
xz 5.4.6 h8cc25b3_0
zlib 1.2.13 h8cc25b3_0
补全所需的一些库
建议选取网速较好,流量充足的地方配置,需要下载约1G的库。
pytorch
在官网上查看得到,选取最新版本的PyTorch,考虑到我的电脑是AMD的集显,选取只用CPU的版本。对于实际情况,结合官网建议,选取适合自己电脑显卡(CPU)的Torch版本。
⇒ 继续在Prompt里面通过conda配置环境。
# CPU Only
conda install pytorch==2.2.0 torchvision==0.17.0 torchaudio==2.2.0 cpuonly -c pytorch
pandas
: 数据处理
pip install pandas
numpy
:数学计算和矩阵等计算
pip install numpy
scipy
:数学计算
pip install scipy
matplotlib
:科研绘图
pip install matplotlib
通常pandas + PyTorch 能一次性装完所有需要的包
seaborn
:画图的
pip install seaborn
scikit-learn
:成套的机器学习包,很方便直接用。
pip install -U scikit-learn
ipykernel
:为了能够愉快地使用交互式的Jupyter,要装。
conda install -n env_AI ipykernel --update-deps --force-reinstall
这个是VS Code 自动安装没成功,强制重新安装的指令
- 确认最终安装成功的列表
conda list
或
pip list
>
# packages in environment at F:\anaconda3\envs\env_AI:
#
# Name Version Build Channel
asttokens 2.0.5 pyhd3eb1b0_0
blas 1.0 mkl
brotli-python 1.0.9 py310hd77b12b_7
bzip2 1.0.8 h2bbff1b_5
ca-certificates 2023.12.12 haa95532_0
certifi 2024.2.2 py310haa95532_0
charset-normalizer 2.0.4 pyhd3eb1b0_0
colorama 0.4.6 py310haa95532_0
comm 0.1.2 py310haa95532_0
contourpy 1.2.0 pypi_0 pypi
cpuonly 2.0 0 pytorch
cycler 0.12.1 pypi_0 pypi
debugpy 1.6.7 py310hd77b12b_0
decorator 5.1.1 pyhd3eb1b0_0
exceptiongroup 1.2.0 py310haa95532_0
executing 0.8.3 pyhd3eb1b0_0
filelock 3.13.1 py310haa95532_0
fonttools 4.49.0 pypi_0 pypi
freetype 2.12.1 ha860e81_0
gmpy2 2.1.2 py310h7f96b67_0
idna 3.4 py310haa95532_0
intel-openmp 2023.1.0 h59b6b97_46320
ipykernel 6.28.0 py310haa95532_0
ipython 8.20.0 py310haa95532_0
jedi 0.18.1 py310haa95532_1
jinja2 3.1.3 py310haa95532_0
joblib 1.3.2 pypi_0 pypi
jpeg 9e h2bbff1b_1
jupyter_client 8.6.0 py310haa95532_0
jupyter_core 5.5.0 py310haa95532_0
kiwisolver 1.4.5 pypi_0 pypi
lerc 3.0 hd77b12b_0
libdeflate 1.17 h2bbff1b_1
libffi 3.4.4 hd77b12b_0
libjpeg-turbo 2.0.0 h196d8e1_0
libpng 1.6.39 h8cc25b3_0
libsodium 1.0.18 h62dcd97_0
libtiff 4.5.1 hd77b12b_0
libuv 1.44.2 h2bbff1b_0
libwebp-base 1.3.2 h2bbff1b_0
lz4-c 1.9.4 h2bbff1b_0
markupsafe 2.1.3 py310h2bbff1b_0
matplotlib 3.8.3 pypi_0 pypi
matplotlib-inline 0.1.6 py310haa95532_0
mkl 2023.1.0 h6b88ed4_46358
mkl-service 2.4.0 py310h2bbff1b_1
mkl_fft 1.3.8 py310h2bbff1b_0
mkl_random 1.2.4 py310h59b6b97_0
mpc 1.1.0 h7edee0f_1
mpfr 4.0.2 h62dcd97_1
mpir 3.0.0 hec2e145_1
mpmath 1.3.0 py310haa95532_0
nest-asyncio 1.6.0 py310haa95532_0
networkx 3.1 py310haa95532_0
numpy 1.26.4 py310h055cbcc_0
numpy-base 1.26.4 py310h65a83cf_0
openjpeg 2.4.0 h4fc8c34_0
openssl 3.0.13 h2bbff1b_0
packaging 23.2 pypi_0 pypi
pandas 2.2.1 pypi_0 pypi
parso 0.8.3 pyhd3eb1b0_0
pillow 10.2.0 py310h2bbff1b_0
pip 23.3.1 py310haa95532_0
platformdirs 3.10.0 py310haa95532_0
prompt-toolkit 3.0.43 py310haa95532_0
prompt_toolkit 3.0.43 hd3eb1b0_0
psutil 5.9.0 py310h2bbff1b_0
pure_eval 0.2.2 pyhd3eb1b0_0
pygments 2.15.1 py310haa95532_1
pyparsing 3.1.1 pypi_0 pypi
pysocks 1.7.1 py310haa95532_0
python 3.10.13 he1021f5_0
python-dateutil 2.8.2 pyhd3eb1b0_0
pytorch 2.2.0 py3.10_cpu_0 pytorch
pytorch-mutex 1.0 cpu pytorch
pytz 2024.1 pypi_0 pypi
pywin32 305 py310h2bbff1b_0
pyyaml 6.0.1 py310h2bbff1b_0
pyzmq 25.1.2 py310hd77b12b_0
requests 2.31.0 py310haa95532_1
scikit-learn 1.4.1.post1 pypi_0 pypi
scipy 1.12.0 pypi_0 pypi
seaborn 0.13.2 pypi_0 pypi
setuptools 68.2.2 py310haa95532_0
six 1.16.0 pyhd3eb1b0_1
sqlite 3.41.2 h2bbff1b_0
stack_data 0.2.0 pyhd3eb1b0_0
sympy 1.12 py310haa95532_0
tbb 2021.8.0 h59b6b97_0
threadpoolctl 3.3.0 pypi_0 pypi
tk 8.6.12 h2bbff1b_0
torchaudio 2.2.0 py310_cpu pytorch
torchvision 0.17.0 py310_cpu pytorch
tornado 6.3.3 py310h2bbff1b_0
traitlets 5.7.1 py310haa95532_0
typing_extensions 4.9.0 py310haa95532_1
tzdata 2024.1 pypi_0 pypi
urllib3 2.1.0 py310haa95532_1
vc 14.2 h21ff451_1
vs2015_runtime 14.27.29016 h5e58377_2
wcwidth 0.2.5 pyhd3eb1b0_0
wheel 0.41.2 py310haa95532_0
win_inet_pton 1.1.0 py310haa95532_0
xz 5.4.6 h8cc25b3_0
yaml 0.2.5 he774522_0
zeromq 4.3.5 hd77b12b_0
zlib 1.2.13 h8cc25b3_0
zstd 1.5.5 hd43e919_0
2024-03-07
end