rubyw-CSDN博客

原创 Python实现KNN算法

【代码】Python实现KNN算法。

2024-02-21 10:49:21 392

原创 Python实现线性逻辑回归和非线性逻辑回归

【代码】Python实现线性逻辑回归和非线性逻辑回归。

2024-02-20 16:29:03 617

原创机器学习：KNN原理（K-近邻）

为了判定未知样本的类别，以全部训练样本作为代表点，计算未知样本与所有训练样本的距离，并以最近邻者的类别作为决策未知样本类别的唯一依据。KNN模型概述。

2024-02-20 11:45:28 289

正确率与召回率（Precision & Recall）是广泛应用于信息检索和统计学分类领域的两个度量值，用来评价结果的质量。一般来说，正确率就是检索出来的条目有多少是正确的，召回率就是所有正确的条目有多少被检索出来了。。是综合上面二个指标的评估指标，用于综合反映整体的指标。这几个指标的取值都在0-1之间，数值越接近于1，效果越好。我们希望检索结果Precision越高越好，同时Recall也越高越好，但事实上这两者在某些情况下有矛盾的。

2024-02-20 10:44:37 343

原创机器学习：逻辑回归原理

逻辑回归模型是一种广泛应用于分类问题的统计方法。尽管名为“回归”，但它实际上是一种分类算法，主要用于预测观察对象属于某个类别的概率。逻辑回归模型特别适用于二分类问题，但也可以通过一些策略扩展到多分类问题。正则化: 为了防止过拟合，可以使用L1或L2正则化。特征工程: 通过特征选择、特征转换或特征构建来改进模型性能。模型评估: 使用准确率、召回率、F1分数、AUC-ROC曲线等指标来评估模型性能。处理多分类问题: 可以使用“一对一”或“一对多”策略将逻辑回归扩展到多分类问题。

2024-02-20 10:35:53 479 2

原创梯度下降法

用梯度下降法求解线性回归线性回归的代价函数是凸函数非凸函数和凸函数梯度下降法优化过程

2024-01-22 16:55:11 339

原创特征缩放、数据归一化、数据标准化

特征缩放数据归一化数据标准化

2024-01-22 16:48:41 354

原创 Python实现Lasso回归模型

• Tibshirani(1996)提出了Lasso(The Least Absolute Shrinkage and Selectionator operator)算法。• 通过构造一个一阶惩罚函数获得一个精炼的模型；通过最终确定一些指标（变量）的系数为零（岭回归估计系数等于0的机会微乎其微，造成筛选变量困难），解释力很强。• 擅长处理具有多重共线性的数据，与岭回归一样是有偏估计。

2024-01-22 16:28:03 671

原创 Python实现交叉验证法

交叉验证是一种用于评估模型性能和选择超参数的方法。其中，k折交叉验证是最常用的形式之一。它将数据集分为k个相似大小的折（folds），然后执行k次训练-测试过程，每次选择一个不同的折用作测试集，其余折用作训练集。最后，将k次测试的性能指标的平均值作为最终性能指标。进行k折交叉验证，并输出交叉验证的均方误差（MSE）得分。这个得分可以用于评估模型性能。将特征转换为多项式特征，并创建一个多项式回归模型。在scikit-learn库中，可以使用。在这个例子中，我们使用。

2024-01-22 16:15:01 578

原创 Python岭回归(Ridge Regression)

【代码】Python岭回归(Ridge Regression)

2024-01-22 16:11:07 1346

原创防止过拟合的方法

防止过拟合的方法：减少特征增加数据量正则化正则化(Regularized)

2024-01-22 15:57:42 334

原创梯度下降法和标准方程法比较

2024-01-22 15:46:26 361

原创 Python线性回归标准方程

【代码】Python线性回归标准方程。

2024-01-22 15:27:38 378

原创 Python多项式回归sklearn

多项式回归是一种回归分析的方法，它通过使用多项式函数来拟合数据。与简单线性回归不同，多项式回归可以更灵活地适应数据的曲线特征，因为它可以包含多个特征的高次项。多项式回归的一般形式为：在实际应用中，可以通过调整多项式的次数来适应不同的数据特征。然而，过高的多项式次数可能导致过拟合，对新数据的泛化能力较差。多项式回归可以通过最小化损失函数来找到最优的回归系数。一种常见的方法是使用最小二乘法。在Python中，可以使用各种库（如NumPy、SciPy和scikit-learn）来实现多项式回归。

2024-01-22 15:01:57 760

原创 Python多元线性回归sklearn

【代码】Python多元线性回归sklearn。

2024-01-22 14:29:03 821

原创 python一元线性回归sklearn

【代码】python一元线性回归sklearn。

2024-01-22 14:16:43 552

原创 python一元线性回归：梯度下降法、损失函数

【代码】python一元线性回归：梯度下降法、损失函数。

2024-01-22 14:11:31 460

原创相关系数与决定系数

原创 python最小二乘估计模型OLS Regression Results含义解释

确定数据的概率分布，这通常由模型的选择决定。

2024-01-18 15:22:24 1189

原创 python最小二乘法回归结果常用参数提取

【代码】python最小二乘法回归结果常用参数提取。

2024-01-18 14:49:10 353

原创 t分布表、F分布表、Z分布表

2024-01-18 14:45:19 414

原创 python：一元线性回归模型案例分析

中国全体居民的消费水平与经济发展数量关系的分析改革开放以来，随着中国经济的快速发展，人民生活水平不断提高，居民的消费水平也在不断增长。研究中国全体居民的消费水平与经济发展的数量关系，对于探寻居民消费增长的规律性，预测居民消费的发展趋势有重要意义。影响居民人均消费水平的因素有多种，但从理论和经验分析，最主要的影响因素应是经济发展水平。从理论上说经济发展水平越高，居民消费越多。被解释变量选择能代表城乡所有居民消费的“全体居民人均年消费水平”(元/人)；

2024-01-18 14:40:46 1619

原创数据智能建设全景图

2024-01-17 09:50:08 346

原创机器学习：线性回归模型的原理、应用及优缺点

线性回归是一种统计学和机器学习中常用的方法，用于建立变量之间线性关系的模型。其原理基于假设因变量（或响应变量）与自变量之间存在线性关系。通过最小二乘法，得到最优的系数，从而建立了线性回归模型。模型的预测值 ( \hat{Y} ) 可以通过将自变量的值带入模型中计算得到。可以使用各种指标来评估模型的性能，如均方误差（Mean Squared Error，MSE）或决定系数（R-squared）。这些指标可以衡量模型对观测数据的拟合程度和预测能力。当存在多个自变量时，模型形式仍然是线性的，只是系数增加了。

2024-01-17 09:04:01 3127

原创机器学习：简要介绍及应用案例

机器学习是一种人工智能（AI）的分支，它致力于研究和开发系统，使它们能够从经验中学习并自动改善。这种学习过程使机器能够适应新的数据，识别模式，做出决策和预测，而无需明确的编程。机器学习的主要目标是通过算法和统计模型，使计算机系统能够执行特定任务而无需明确的规则。这种学习的方式通常分为监督学习、无监督学习和强化学习。在监督学习中，算法从带有标签的训练数据中学习。它学会将输入与相应的输出关联起来，然后用这个关联关系对新的未标记数据进行预测。无监督学习中，算法处理没有标签的数据，试图发现数据中的模式和结构。

2024-01-16 16:52:00 731 1

武汉echarts地图js文件

苏州echarts地图js文件

MongoDB-windows-x86-64-5.0.20

Linux: CentOS 6.8

Tableau 10.5.0

intellij idea 2019.2

linux:CentOS6.9

空空如也