机器学习
文章平均质量分 93
林梓烯
这个作者很懒,什么都没留下…
展开
-
机器学习——主成分分析(PCA)
给定n个样本(每个样本的维度为p维)定义为样本在第一主成分/主方向上的投影:其中和都是用向量表示的:每个样本都对应一个,两个向量进行内积运算就能将映射到方向上,,如果将的模约束为1,那么和的内积就是,即样本在主方向上的投影。(为什么是,如果我没理解错的话,和都是列向量,两个向量的内积应该就是第一个转置成行向量与第二个列向量相乘)主成分分析的目标是找到,使得的方差最大,同时要满足约束条件。原创 2023-12-30 18:00:15 · 1743 阅读 · 0 评论 -
机器学习——logistic回归
在之前实验接触到的机器学习算法都是的目的都是对数据集进行分类,即预测得到的结果是数据样本所属的类别,预测输出结果是离散的集合,比如{‘是’,‘不是’}。这次实验学习的是回归模型,与分类模型不同的是,回归模型预测得到的是一个连续的数值,比如预测房价、温度等得到的值都是连续值。logistic回归就是一种回归模型,但是logistic回归得到的预测结果是分类,它虽然在中间过程是回归,但使用它的目的和它预测的结果是分类。这次实验学习的就是使用logistic回归执行分类任务。原创 2023-12-04 21:57:38 · 1131 阅读 · 0 评论 -
机器学习——决策树
决策树是一个基于树形结构的分类模型,它将数据集中的不同特征的不同取值对数据集进行分割,构造出一个树形结构,这个树形结构就是决策树,使用决策树能够进行分类任务,预测数据样本的分类。我们使用的分类算法是k近邻算法,它是一个很容易实现的分类模型,可以完成很多的分类任务,但它最大的缺点就是无法给出数据的内在含义,因为它只是通过计算样本点的距离来进行分类的,这个距离并不包含对该样本分类的实际意义,而决策树的每一个分类都有对应一组特征判断的条件,可以很直观的看出分类规则,其数据形式非常容易理解。原创 2023-11-06 20:50:56 · 846 阅读 · 0 评论 -
分类模型性能评估
上次实验我们已经实现了knn算法,这次实验我们来对分类算法进行性能评估。上次实验我们对knn分类器的性能评估只有错误率这一个单一的指标,对其的评估较为片面,这次实验我们将使用精确率Precision、召回率Recall 等指标以及ROC曲线和PR曲线对分类器进行更加全面的评估。原创 2023-10-20 11:04:23 · 170 阅读 · 1 评论 -
k-近邻算法初体验
自上次实验安装完vscode和anaconda并配置好环境后,我们就可以开始进行机器学习的实验了。今天我们要开始第一次尝试写机器学习的算法,本次实验选取较为简单的k-近邻算法作为入门的机器学习算法。原创 2023-10-09 20:30:00 · 93 阅读 · 3 评论 -
vscode+anaconda安装及conda虚拟环境的激活
下载安装包直接点击安装即可。原创 2023-09-25 21:17:32 · 7756 阅读 · 1 评论