机器学习入门
文章平均质量分 74
小浪要学习
用来记录学习生活与所得,大家一起努力
展开
-
【机器学习实战】南非心脏病数据——基于逻辑回归
南非心脏病数据 SAheart包SAheart是R语言中的一个数据包,其中包含了南非心脏病数据集。该数据集提供了关于南非人口样本的心脏病相关的信息。南非心脏病数据集(South African Heart Disease Data)收集了一组有关心脏病风险因素的数据。该数据集由5个县的462个个体组成,其中包括了有关他们的年龄、性别、体重指数、收缩压、胆固醇水平等多个特征。该数据集的目的是研究这些风险因素与心脏病之间的关系。原创 2023-06-30 12:00:00 · 1247 阅读 · 0 评论 -
【机器学习入门】文本分析基础概念与方法
为文本挖掘。通过对文本内部特征提取,获取隐含的语义信息或概括性主题,从而产生高质量的结构化信息,合理的文本分析技术能够获取作者的真实意图。原创 2023-04-24 12:00:00 · 1822 阅读 · 1 评论 -
机器学习:利用线性判别对种子进行分类并做可视化
线性判别分析(Linear Discriminant Analysis,LDA)是一种经典的统计学习方法,主要用于分类问题。它的原理基于贝叶斯决策理论,假设数据服从多元正态分布,并试图寻找一个能够最大化类间差异、同时最小化类内差异的线性投影方向,以实现对数据的分类。原创 2023-04-03 15:44:54 · 777 阅读 · 0 评论 -
【机器学习入门】决策树算法(四):CART算法(Classification and Regression Tree)
CART(Classification and Regression Tree)算法,即分类回归树算法,也是决策树构建的一种常用算法。原创 2023-03-06 17:36:46 · 1588 阅读 · 0 评论 -
【机器学习入门】决策树算法(三):C5.0算法
C5.0算法是一种决策树模型,由J R Quinlan在C4.5算法的基础上改进而来,适用于处理大数据集。原创 2023-03-07 08:00:00 · 3222 阅读 · 0 评论 -
【机器学习入门】决策树算法(二):C4.5算法
C4.5算法是一种决策树学习算法,是ID3算法的改进版本。它与ID3算法类似,也是通过选择信息增益最大的特征构造决策树的模型,但是C4.5算法在信息增益的计算方法上做了一些改进。原创 2023-02-14 08:00:00 · 343 阅读 · 0 评论 -
【机器学习入门】决策树算法(一):ID3(Iterative Dichotomiser 3)算法
ID3是一种决策树学习算法,是一种机器学习技术,通过选择最优的特征,构造决策树模型来完成分类任务。原创 2023-02-06 08:00:00 · 1247 阅读 · 0 评论 -
【机器学习入门】解决过拟合的又一方法:交叉验证
在上一篇文章当中我们说到,可以使用正则化来解决过拟合问题,今天我们再来介绍另一种方法:交叉验证法。那么,什么是交叉验证呢?原创 2023-02-04 08:00:00 · 1168 阅读 · 0 评论 -
【机器学习入门】避免过拟合的方法之一:正则化
避免过拟合的方法比较多,但是较为常用的就是正则化。什么是正则化?正则化是如何避免过拟合的?正则化都有哪几种形式?还请一字一句看看原创 2023-02-01 18:15:00 · 622 阅读 · 0 评论 -
【机器学习入门】常用损失函数以及简介
一些损失函数的图像原创 2023-01-29 21:03:27 · 919 阅读 · 0 评论