Conda是一个开源的、跨平台的软件包管理和环境管理工具,可以简化软件包和依赖项的管理和部署过程,并支持多种语言,包括Python、R、Ruby、Lua、Scala、Java、JavaScript、C/C++和FORTRAN等。
Windows系统:
- 下载并安装Anaconda:
- 访问Anaconda官方网站(https://www.anaconda.com/products/individual),选择Windows平台对应的版本进行下载。
- 双击下载的exe安装文件,并按照安装向导的指示进行安装。等待安装完成。
- 启动conda并验证安装:
- 打开命令提示符(cmd)或PowerShell。
- 输入命令
conda -V
来验证conda的安装是否正确。如果成功安装了conda,它将显示版本信息。
- 创建虚拟环境(可选):
- 使用命令
conda create -n <env_name> python=<version>
来创建一个新的虚拟环境,其中<env_name>
是环境的名称,<version>
是所需的Python版本。 - 激活虚拟环境,使用命令
conda activate <env_name>
。
- 使用命令
- 退出虚拟环境:
- 使用命令
conda deactivate
来退出当前虚拟环境。
- 使用命令
附上昨天下午讲解的knn算法鸢尾花案例:
鸢尾花数据集是一个常用的多类分类数据集,包含了150个样本,每个样本有4个特征(花萼长度、花萼宽度、花瓣长度、花瓣宽度),以及一个标签(鸢尾花的种类,包括setosa、versicolour、virginica三种)。
python复制代码
# 导入必要的库 |
from sklearn import datasets |
from sklearn.model_selection import train_test_split |
from sklearn.preprocessing import StandardScaler |
from sklearn.neighbors import KNeighborsClassifier |
from sklearn.metrics import classification_report, confusion_matrix |
# 加载鸢尾花数据集 |
iris = datasets.load_iris() |
X = iris.data |
y = iris.target |
# 划分训练集和测试集 |
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1) |
# 数据标准化处理 |
sc = StandardScaler() |
X_train_std = sc.fit_transform(X_train) |
X_test_std = sc.transform(X_test) |
# 创建KNN分类器 |
knn = KNeighborsClassifier(n_neighbors=3) |
# 使用训练集数据训练模型 |
knn.fit(X_train_std, y_train) |
# 使用测试集数据进行预测 |
y_pred = knn.predict(X_test_std) |
# 打印分类报告和混淆矩阵 |
print(classification_report(y_test, y_pred)) |
print(confusion_matrix(y_test, y_pred)) |