HNU 数据挖掘实验1 实验报告

原创已于 2025-11-30 21:24:15 修改 · 865 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#数据挖掘 #人工智能

于 2025-11-30 21:23:30 首次发布

数据挖掘专栏收录该内容

4 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

实验一：实验平台及环境安装

课程：数据挖掘（Data Mining）
操作系统：Windows 11

1. 实验目的

掌握在 Windows 平台下安装与配置 Python 环境的方法。
掌握 Anaconda 的安装、环境管理与常用命令。
能够创建独立 Python 环境（本实验要求：创建名为 DM 的 Python 3.7 环境）。
熟练安装 PyCharm、Jupyter Notebook 等常用开发工具。
能够安装 PyTorch 2.2.2 及常见第三方库（numpy、pandas、tensorflow、h5py、mygene、matplotlib、seaborn、umap-learn）。
熟悉 pip 与 conda 的软件包管理方式。

2. 实验环境

Windows 11
Anaconda（Python 发行版）
PyCharm（Community 或 Professional）
Jupyter Notebook
Python 3.7
PyTorch 2.2.2（CPU/GPU 版本均可）

3. 实验内容与步骤

3.1 安装 Anaconda

从官网下载适用于 Windows 的 Anaconda 安装包。
双击安装程序，按默认设置安装
- 勾选 Add Anaconda to my PATH（可选）。
- 推荐使用 Anaconda Prompt 管理环境。
安装完成后，打开 Anaconda Prompt 验证：

conda --version

![[Pasted image 20251128224049.png]]
由于之前已经安装过，所以版本较旧。

3.2 创建 Python 环境 DM（Python 3.7）

在 Anaconda Prompt 中输入：

conda create -n DM python=3.7 -y # 创建名为 DM 的 Python3.7 环境
conda activate DM # 激活环境

![[Pasted image 20251128225214.png]] ![[Pasted image 20251128230849.png]]
查看环境是否创建成功：

conda env list

![[Pasted image 20251128230954.png]]
可以看到在conda环境列表中已经有了DM，说明环境创建成功。

3.3 安装 Jupyter Notebook

Anaconda 自带 Jupyter，如缺失或希望重新安装，可执行：

conda install jupyter -y

启动 Jupyter：

jupyter notebook

浏览器正常打开 Jupyter 即成功。
![[Pasted image 20251128233351.png]]
![[Pasted image 20251128233519.png]]

3.4 安装 PyCharm

从 JetBrains 官网下载并安装 PyCharm。
安装完成后打开 PyCharm → File → Settings → Project → Python Interpreter
选择：
- Add Interpreter → Conda Environment → Existing Environment
- 选择路径：<Anaconda路径>\Scripts\conda.exe
点击 OK，让项目使用 DM 环境的解释器。

3.5 在 DM 环境安装 PyTorch 2.2.2

安装 GPU（CUDA）版本，例如 CUDA 12.1：

conda install pytorch==2.2.2 torchvision torchaudio cudatoolkit=11.8 -c pytorch -y

验证 PyTorch：

python -c "import torch; print(torch.__version__, torch.cuda.is_available())"

输出版本号说明安装成功。
在这里插入图片描述

在安装 Pytorch 的时候，发现 Pytorch=2.2.2 要求 python 版本>=3.10，与我们的 python 3.7 冲突。于是只好将 python 升级成3.10.

3.6 安装常用数据科学库

使用 conda 安装常见库

conda activate DM conda install numpy pandas matplotlib seaborn scikit-learn scipy -y

![[Pasted image 20251129182346.png]]
在这里插入图片描述
使用 conda-forge 安装 umap-learn

conda install -c conda-forge umap-learn -y

![[Pasted image 20251129182748.png]]
其余库使用 pip 安装

pip install h5py mygene

![[Pasted image 20251129184720.png]]

3.7 pip 与 conda 常用命令总结

conda 常用命令

conda create -n envname python=3.X     # 创建环境 
conda activate envname                 # 激活环境 
conda deactivate                       # 退出环境 
conda install package                  # 安装包 
conda list                             # 查看已安装包 
conda remove -n envname --all          # 删除环境

pip 常用命令

pip install package                    # 安装包
pip uninstall package                  # 卸载包
pip list                               # 查看已安装包
pip install -U package                 # 更新包

4. 实验心得

通过本次实验，我系统地完成了在 Windows 平台下搭建 Python 数据挖掘环境的全过程，包括 Anaconda 安装、虚拟环境管理、Jupyter Notebook 与 PyCharm 的使用，以及 PyTorch 等关键库的安装配置。在实践中我深刻感受到虚拟环境的重要性，它能够避免不同项目之间的依赖冲突，使得实验环境更加稳定可控。同时，通过手动安装多个常用库，我进一步理解了 conda 与 pip 的区别，以及在不同场景下如何选择更合适的包管理方式。
在配置 PyTorch 的过程中，我也认识到 CPU/GPU 版本的差异以及 CUDA 兼容性的重要性，这对后续深度学习相关实验非常关键。整体而言，本次实验不仅提高了我对 Python 科学计算环境的搭建能力，也让我对数据挖掘实验中常见工具链的结构有了更清晰的认识，为后续的建模、训练和分析提供了坚实基础。

您可能感兴趣的与本文相关的镜像

Python3.9

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本