python机器学习
文章平均质量分 59
司南锤
这个作者很懒,什么都没留下…
展开
-
Mercer 条件的基本概念及证明
设KxyK(x, y)Kxy是一个定义在X×XX×X上的对称函数,其中XX是一个紧致的度量空间。Mercer 条件要求KxyK(x, y)Kxy满足以下性质:对于任意有限输入集x1x2xn⊂Xx1x2xn⊂X和任意实值函数fff∬Kxyfxfydxdy≥0∬Kxyfxfydxdy≥0这意味着KxyK(x, y)Kxy是一个半正定函数。设Kxy。原创 2024-07-08 17:26:27 · 789 阅读 · 0 评论 -
核函数的深入理解
(Kernel Function)是一种在高维特征空间中隐式计算内积的方法,它允许在原始低维空间中通过一个简单的函数来实现高维空间中的内积计算,而无需显式地计算高维特征向量。,是因为核函数本身具有特定的数学性质,特别是满足 Mercer 条件。这种方法的优势在于,高维空间中的计算可能非常复杂和耗时,而核函数提供了一种高效的方式来处理这些计算。通过选择合适的核函数,可以在低维空间中隐式地进行高维空间的内积计算,从而实现非线性分类和回归等任务。的定义,就可以直接计算高维空间中的内积。,在低维空间中的内积是。原创 2024-07-08 17:21:47 · 659 阅读 · 0 评论 -
线性核函数
Kxyx⋅yKxyx⋅y其中,xxx和yyy是输入空间的向量,⋅\cdot⋅表示向量的点积(内积)。原创 2024-07-08 16:57:29 · 438 阅读 · 0 评论 -
统计学习方法三要素的理解 (以线性回归为例)
统计学习方法的三要素通常指的是模型(Model)、策略(Strategy)和算法(Algorithm)。这三个要素是构建和应用统计学习方法的基础。:模型是指统计学习方法中用来描述数据生成过程的数学模型。在监督学习中,模型通常是一个函数集合,表示输入数据到输出数据的映射关系。例如,线性回归模型、决策树模型、神经网络模型等。:策略是指在统计学习方法中用来选择最优模型的准则。策略通常包括损失函数(Loss Function)和正则化项(Regularization Term)。原创 2024-07-05 20:55:22 · 644 阅读 · 0 评论 -
DataWhale-吃瓜教程学习笔记 (七)
第六章。原创 2024-07-05 19:35:04 · 957 阅读 · 0 评论 -
统计学习原理中的“数据是独立同分布产生的”如何理解
在统计学习原理中,“数据是独立同分布产生的”(Independent and Identically Distributed,简称 i.i.d.)是一个核心假设。在实际应用中,数据往往不完全满足 i.i.d. 假设,例如在时间序列数据或某些依赖性较强的数据集中,需要采用更复杂的模型和方法来处理数据的依赖性和分布变化。结合两个概念,i.i.d. 假设意味着数据集中的每个样本点都是从同一个概率分布中独立抽取的。这个假设简化了统计学习中的许多问题。原创 2024-07-05 18:05:40 · 135 阅读 · 0 评论 -
DataWhale-吃瓜教程学习笔记 (六)
特点永远是非负的没有误分类点,损失函数为0误分类点越少,离超平面越近,损失函数值越小将其中的−Θ-\Theta−Θ看作一定值的变量,写作wTxiw^T x_iwTxi的形式作为第 n+1 位,可将上式简化为。原创 2024-07-03 10:13:49 · 267 阅读 · 0 评论 -
scikit-learn超参数调优 (自动寻找模型最佳参数) 方法
【代码】scikit-learn超参数调优 (自动寻找模型最佳参数) 方法。原创 2024-07-02 11:22:34 · 481 阅读 · 0 评论 -
DataWhale-吃瓜教程学习笔记 (五)
第四章 4.1;4.2。原创 2024-06-29 14:25:55 · 410 阅读 · 0 评论 -
DataWhale-吃瓜教程学习笔记(四)
二分类线性判别分析原创 2024-06-28 13:36:23 · 1013 阅读 · 0 评论 -
DataWhale - 吃瓜教程学习笔记(三)
对数几率回归原创 2024-06-25 08:27:50 · 265 阅读 · 0 评论 -
DataWhale - 吃瓜教程学习笔记(一)
瓜书绪论原创 2024-06-16 21:08:51 · 772 阅读 · 0 评论 -
Pytorch学习入门教程
优质教程1. 深入浅出PyTorch — 深入浅出PyTorch原创 2024-04-28 11:46:54 · 166 阅读 · 0 评论 -
JupyterNotebook 如何切换使用的虚拟环境kernel
在弹出的窗口中,列出了所有可用的内核。如果没有,则需要安装。首先,需要确保虚拟环境已经安装conda上。的顶部菜单中,选择 “New”替换为你的虚拟环境的名称)。包,在虚拟环境中运行。原创 2024-03-19 21:00:20 · 756 阅读 · 0 评论 -
conda 的基础操作
是一个开源的包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并能够在它们之间轻松切换。原创 2024-03-19 19:15:16 · 422 阅读 · 0 评论 -
mlflow ui --backend-store-uri 参数详解
这里的 `sqlite:///` 是 SQLite 数据库的 URI 方案,`path/to/mlflow.db` 是 SQLite 数据库文件的路径。这个 URI 定义了 MLflow 如何连接到后端存储,包括数据库类型、主机名、端口号、用户名、密码和数据库名等信息。后端存储是 MLflow 用于存储实验、运行、参数、指标和模型元数据的地方。使用 MySQL 或其他数据库,需要安装相应的 Python 数据库驱动程序,例如 `pymysql` 或 `psycopg2`。在 MLflow 中,原创 2024-03-18 21:40:10 · 470 阅读 · 0 评论 -
获取所有文件地址代码
【代码】获取所有文件地址代码。原创 2023-08-20 11:52:17 · 82 阅读 · 0 评论 -
Python保存模型并对其进行加载
Python保存模型并对其进行加载。加载使用模型具体方法。原创 2023-02-02 17:37:46 · 218 阅读 · 0 评论 -
Python评价回归计算的准确性
● 解释方误差: 可以衡量模型对数据集波动的解释能力,得分为1.0则表明模型十分完美。● 中位数绝对误差: 数据集的所有数据点的误差的中位数,可以消除异常值的影响。● 均方误差(MSE): 所有数据点误差的平方的平均值。● 平均绝对误差: 所有数据点的 绝对误差平均值。● R方得分: 最好为1.0,可以是负数。Python评价回归计算的准确性。以下为回归器拟合效果的重要指标。原创 2023-02-02 17:29:42 · 191 阅读 · 0 评论 -
使用python对数据进行预处理
使用Python进行数据预处理。原创 2023-02-02 17:07:53 · 728 阅读 · 0 评论