![](https://img-blog.csdnimg.cn/f4e6b1dcb61840398c23cd9685da007b.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python 机器学习 (scikit-learn)
文章平均质量分 86
Python 机器学习 (scikit-learn)
谢TS
持续写了十几年代码,未来也将继续不停写代码的老程序员,后端工程师。
展开
-
Python 机器学习(scikit-learn)(总目录)
Python 机器学习/scikit-learn(总目录)原创 2023-05-30 21:16:43 · 166 阅读 · 0 评论 -
Python机器学习(scikit-learn):监督学习 --- 神经网络(深度学习)
神经网络算法,又叫“深度学习”。虽然深度学习在许多机器学习应用中都有巨大的潜力,但深度学习算法往往经过精确调整,只适用于特定的使用场景。scikit-learn 中实现了可用于分类和回归的 多层感知机(multilayer perceptron, MLP),它可以作为研究复杂深度学习算法的起点。MLP 也被称为(普通)前馈神经网络,有时也简称为神经网络。原创 2023-05-31 21:07:12 · 594 阅读 · 0 评论 -
Python机器学习(scikit-learn):监督学习 --- 支持向量机
支持向量机(SVM) 是一组用于分类、 回归和异常值检测的监督学习方法。支持向量机的优点是:在高维空间中有效。在维度数大于样本数的情况下仍然有效。在决策函数中使用训练点的子集(称为支持向量),因此它也具有内存效率。通用性:可以为决策函数指定不同的内核函数。提供了通用内核,但也可以指定自定义内核。支持向量机的缺点包括:如果特征数量远大于样本数量,在选择核函数时避免过度拟合,正则化项至关重要。SVM 不直接提供概率估计,这些是使用昂贵的五折交叉验证计算的。原创 2023-05-31 21:05:21 · 300 阅读 · 0 评论 -
Python机器学习(scikit-learn):监督学习 --- 决策树、随机森林、梯度提升决策树
决策树是广泛用于分类和回归任务的模型。本质上它是从一层层 if/else 问题中进行学习并得出结论。集成(ensemble) 是合并多个机器学习模型来构建更强大模型的方法。决策树的主要缺点在于,即使做了预剪枝,它也经常会过拟合,泛化性能很差。因此,在大多数应用中,往往使用集成方法来替代单棵决策树。在机器学习文献中有许多模型都属于集成方法,大量实例已证明有两种集成模型对大量分类和回归的数据集都是有效的,二者都以决策树为基础,分别是 随机森林(random forest) 和 梯度提升决策树(gradient原创 2023-05-31 21:01:57 · 690 阅读 · 0 评论 -
Python机器学习(scikit-learn):监督学习 --- 朴素贝叶斯(分类器)
朴素贝叶斯分类器与线型模型分类器非常相似,但它的训练速度往往更快。这种高效率所付出的代价是,朴素贝叶斯模型的泛化能力比线型模型分类器(如 LogisticRegression 和 LinearSVC)稍差。朴素贝叶斯训练模型高效的原因在于,它通过单独查看每个特征来学习参数,并从每个特征中收集简单类别统计数据。原创 2023-05-31 20:59:14 · 309 阅读 · 0 评论 -
Python机器学习(scikit-learn):监督学习 --- 线型模型(线型回归、岭回归、逻辑回归)、样本生成器、方法链
线型回归,又名普通最小二乘法。LinearRegression 实现了基于普通最小二乘法的线性回归,以最小化数据集中观察到的目标与通过线性近似预测的目标之间的残差平方和,来拟合具有系数 w = (w1, ..., wp) 的线性模型。原创 2023-05-31 20:52:38 · 358 阅读 · 0 评论 -
Python机器学习(scikit-learn):监督学习 --- k最近邻 (k-NN)、特征缩放(标准化数据/归一化数据)
k近邻算法 (k-NN, K-NearestNeighbor)。k-NN 算法构建模型只需要保存训练集数据即可。k-NN 模型把样本的所有特征构造一个坐标系(二维、三维 或 更高维),每一个样本都在坐标系中对应一个点(坐标由样本的所有特征组成)。想对新数据点做出预测,算法会在训练集数据点构成的坐标系中找到最近的 k 个数据点(也就是它的“最近邻”),然后根据这个 k 个数据点对新数据做出预测。当样本特征数据在运算时,为了减小不同特征取值范围误差,可以把特征数据缩放为标准化数据。均值为 0,方差为 1 的数据原创 2023-05-30 21:46:57 · 657 阅读 · 0 评论 -
Python机器学习(scikit-learn):scikit-learn 简介
scikit-learn 是基于 Python 语言的用于预测数据分析的简单高效机器学习库。它提供了用于机器学习的算法,包括 分类、回归、降维 和 聚类。它也提供了用于数据预处理、提取特征、优化超参数和评估模型的模块。scikit-learn 基于 NumPy、SciPy 和 matplotlib 构建。开源,商业可用 - BSD 许可证。原创 2023-05-30 21:24:24 · 1333 阅读 · 0 评论