概念及理论
机器学习的概念和理论
rubyw
Data Analyst
让我们一起愉快地搞数据分析吧!
展开
-
机器学习:KNN原理(K-近邻)
为了判定未知样本的类别,以全部训练样本作为代表点,计算未知样本与所有训练样本的距离,并以最近邻者的类别作为决策未知样本类别的唯一依据。KNN模型概述。原创 2024-02-20 11:45:28 · 278 阅读 · 0 评论 -
机器学习:如何评估分类结果
正确率与召回率(Precision & Recall)是广泛应用于信息检索和统计学分类领域的两个度量值,用来评价结果的质量。一般来说,正确率就是检索出来的条目有多少是正确的,召回率就是所有正确的条目有多少被检索出来了。。是综合上面二个指标的评估指标,用于综合反映整体的指标。这几个指标的取值都在0-1之间,数值越接近于1,效果越好。我们希望检索结果Precision越高越好,同时Recall也越高越好,但事实上这两者在某些情况下有矛盾的。原创 2024-02-20 10:44:37 · 334 阅读 · 0 评论 -
机器学习:逻辑回归原理
逻辑回归模型是一种广泛应用于分类问题的统计方法。尽管名为“回归”,但它实际上是一种分类算法,主要用于预测观察对象属于某个类别的概率。逻辑回归模型特别适用于二分类问题,但也可以通过一些策略扩展到多分类问题。正则化: 为了防止过拟合,可以使用L1或L2正则化。特征工程: 通过特征选择、特征转换或特征构建来改进模型性能。模型评估: 使用准确率、召回率、F1分数、AUC-ROC曲线等指标来评估模型性能。处理多分类问题: 可以使用“一对一”或“一对多”策略将逻辑回归扩展到多分类问题。原创 2024-02-20 10:35:53 · 467 阅读 · 2 评论 -
梯度下降法
用梯度下降法求解线性回归线性回归的代价函数是凸函数非凸函数和凸函数梯度下降法优化过程原创 2024-01-22 16:55:11 · 339 阅读 · 0 评论 -
特征缩放、数据归一化、数据标准化
特征缩放数据归一化数据标准化原创 2024-01-22 16:48:41 · 353 阅读 · 0 评论 -
防止过拟合的方法
防止过拟合的方法:减少特征增加数据量正则化正则化(Regularized)原创 2024-01-22 15:57:42 · 334 阅读 · 0 评论 -
梯度下降法和标准方程法比较
原创 2024-01-22 15:46:26 · 361 阅读 · 0 评论 -
python一元线性回归sklearn
【代码】python一元线性回归sklearn。原创 2024-01-22 14:16:43 · 545 阅读 · 0 评论 -
相关系数与决定系数
相关系数决定系数原创 2024-01-22 11:29:05 · 379 阅读 · 0 评论 -
数据智能建设全景图
原创 2024-01-17 09:50:08 · 345 阅读 · 0 评论 -
机器学习:线性回归模型的原理、应用及优缺点
线性回归是一种统计学和机器学习中常用的方法,用于建立变量之间线性关系的模型。其原理基于假设因变量(或响应变量)与自变量之间存在线性关系。通过最小二乘法,得到最优的系数,从而建立了线性回归模型。模型的预测值 ( \hat{Y} ) 可以通过将自变量的值带入模型中计算得到。可以使用各种指标来评估模型的性能,如均方误差(Mean Squared Error,MSE)或决定系数(R-squared)。这些指标可以衡量模型对观测数据的拟合程度和预测能力。当存在多个自变量时,模型形式仍然是线性的,只是系数增加了。原创 2024-01-17 09:04:01 · 2627 阅读 · 0 评论 -
机器学习:简要介绍及应用案例
机器学习是一种人工智能(AI)的分支,它致力于研究和开发系统,使它们能够从经验中学习并自动改善。这种学习过程使机器能够适应新的数据,识别模式,做出决策和预测,而无需明确的编程。机器学习的主要目标是通过算法和统计模型,使计算机系统能够执行特定任务而无需明确的规则。这种学习的方式通常分为监督学习、无监督学习和强化学习。在监督学习中,算法从带有标签的训练数据中学习。它学会将输入与相应的输出关联起来,然后用这个关联关系对新的未标记数据进行预测。无监督学习中,算法处理没有标签的数据,试图发现数据中的模式和结构。原创 2024-01-16 16:52:00 · 720 阅读 · 1 评论 -
机器学习:常见符号含义
原创 2024-01-15 14:34:10 · 360 阅读 · 0 评论 -
机器学习:自然语言处理介绍
总的来说,机器学习在自然语言处理中的应用范围广泛,不断涌现出新的模型和技术,推动着自然语言处理领域的发展。深度学习模型,如卷积神经网络(CNN)和循环神经网络(RNN),在情感分析中表现良好。机器学习在自然语言处理(NLP)领域扮演着关键的角色,它利用算法和统计模型来处理和理解人类语言。利用生成模型,如循环神经网络(RNN)或变分自编码器(VAE),可以实现自然语言的生成,包括文章、对话等。BERT 是一种预训练的语言模型,通过双向上下文理解,取得了在多个 NLP 任务上的优异表现。原创 2024-01-09 15:50:03 · 642 阅读 · 0 评论 -
机器学习:数据处理与特征工程
机器学习中的数据处理和特征工程是非常关键的步骤,它们直接影响模型的性能和泛化能力。原创 2024-01-09 14:05:05 · 912 阅读 · 1 评论