机器学习python
文章平均质量分 86
(ง •_•)ง up
这个作者很懒,什么都没留下…
展开
-
python 实现集成学习与随机森林(机器学习)
首先,导入几个常用模块,确保MatplotLib绘制图形,并准备一个保存图形的函数。还要检查是否安装了Python 3.5或更高版本(尽管Python 2。x可以工作,它已被弃用,因此建议使用Python 3代替),以及Scikit-Learn≥0.20。原创 2024-03-08 10:05:38 · 658 阅读 · 1 评论 -
机器学习- K-Means聚类-mushroom dataset-蘑菇数据集 python scikit-learn
无监督学习- K-Means聚类K-Means聚类是一种无监督学习算法。在无监督学习中,机器学习模型在训练过程中没有得到标签。相反,它必须自己找出标签。K-Means聚类需要在训练前指定簇的数量。K-Means将随机分配数据样本到所有聚类的初始质心。这个步骤称为初始化。质心也被称为集群中心,它是集群中所有样本数据的平均值。然后将样本重新分配到最近的质心。通过取分配给每个先前质心的所有样本的平均值来找到所有簇的新质心。重复最后两个步骤,直到满足停止准则或新旧质心之差恒定为止。原创 2024-02-07 11:51:36 · 525 阅读 · 1 评论 -
机器学习-线性回归-python scikit-learn 房价预测
本教程在anaconda中的notebook进行实现,python版本3.10.9。线性回归-房价数据,scikit-learn。该模型很简单,因此可以尝试其他复杂的模型,如随机森林、决策树或集成方法。因为我们将在下一个实验中讨论这些模型。另外,需要注意的是,大多数情况下,如果您有一个简单的数据集,简单模型将工作得很好,因为复杂模型可能会过拟合数据。此外,好的模型来自好的数据,所以最好花时间整理数据,而不是在模型中来回跳来跳去。原创 2024-02-01 15:51:09 · 1229 阅读 · 1 评论 -
机器学习-支持向量机(SVM) -分类-鸢尾花-python scikit-learn
本实验将使用鸢尾花数据集。该数据集包含3个物种,分别是:“鸢尾”、“鸢尾”、“鸢尾”。这些物种就是我们所指的类别/类。特征是萼片长度、萼片宽度、花瓣长度、花瓣宽度。所有特征均以厘米(cm)为单位测量。每个物种有50个样本,所以所有物种有150个样本。这是关于使用支持向量机进行分类任务的实验的结束。SVM是一个健壮的算法,因为它支持不同的核。这些核使得它既适用于线性问题也适用于非线性问题。在现实世界中,许多数据集都不是线性的。所以当你不能用线性模型得到好的结果时,试试用多项式核的SVM。原创 2024-02-02 10:56:59 · 1496 阅读 · 0 评论 -
机器学习-决策树-回归-CPU(中央处理单元)数据-python scikit-learn
决策树是一种监督机器学习算法,用于回归和分类任务。树是可以处理复杂数据集的强大算法。不需要数值输入数据进行缩放。无论数值是多少,决策树都不在乎。不同于其他复杂的学习算法,决策树的结果是可以解释的,决策树不是黑盒类型的模型。虽然大多数模型都有缺失值的问题,但决策树却没有问题。树可以处理不平衡的数据集,只需要调整类的权重。树可以提供特征的重要性或每个特征对模型训练结果的贡献。树是随机森林和梯度增强机等集成方法的基本构建块。决策树的工作方式就像一系列if/else问题。原创 2024-02-06 13:58:14 · 902 阅读 · 1 评论 -
机器学习-支持向量机(SVM) -回归-python scikit-learn
支持向量机是一种用于回归、分类和检测异常值的监督学习算法。支持向量机是经典机器学习中非常强大的模型之一,适用于处理复杂的高维数据集。支持向量机支持不同的核(线性、多项式、径向基函数(rbf)和sigmoid),支持向量机可以处理不同类型的数据集,包括线性和非线性。支持向量机的工作方式可以比作有边界线的间隔。在SVM训练过程中,SMV根据每个训练数据点的重要程度绘制类之间的较大裕度或决策边界。在决策边界内的训练数据点称为支持向量。这是一个使用支持向量机进行回归的实验介绍。原创 2024-02-02 10:10:46 · 559 阅读 · 0 评论 -
机器学习-决策树-分类-汽车数据集-fetch_openml python scikit-learn
在这个使用决策树的分类任务中,将使用OpenML提供的汽车数据集来预测给定汽车信息的汽车可接受性。将使用Sklearn ’ fetch_openml '函数加载它。此次获取的数据的版本是2。在数据集的版本1中,目标类有4个类(unacc, acc, good, vgood),但在第二个版本中,大多数类是Positive§,而其余的是Negative§。如果要查看版本1,可以在下面的单元格中更改版本参数。以下是有关数据的信息:buying:汽车的购买价格(vhigh, high, med, low)原创 2024-02-06 14:43:07 · 1108 阅读 · 1 评论