自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习算法-决策树

决策树有很多算法,它们的区别是所选择的划分标准不一样,ID3选择的是信息增益,C4.5选择的是信息增益比,当CART是分类树时,采用GINI值作为节点分裂的依据;具体来说,该算法首先计算每个特征的信息熵,然后计算每个特征对应的信息增益,最后选取信息增益最大的特征作为分裂点。在C4.5算法中,我们首先需要计算每个特征的信息增益比,然后选取信息增益比最大的特征作为分裂点。决策树的缺点:决策树容易过拟合,对于不平衡数据集容易出现错误,处理连续值类型的特征时需要离散化,当分类过多时,决策树容易失效。

2023-10-08 12:05:19 61 1

原创 机器学习-集成算法

集成算法是一种机器学习方法,通过将多个基学习器集成起来,构建一个更加强大的学习模型。

2023-09-20 13:15:00 606 1

原创 机器学习-时间序列

时间序列:它是指一系列按时间顺序排列的数据点。在机器学习中,时间序列常被用来进行预测和分析。

2023-09-18 13:16:13 1129

原创 机器学习无监督算法

1)根据用户指定的簇数量K,选择随机的K个样本作为初始聚类中心。2)通过计算每个样本与聚类中心的距离,将样本分配给最近的簇。3)根据簇内样本的均值更新聚类中心,重复以上步骤直到聚类中心不再变化或达到最大迭代次数。

2023-09-13 17:48:11 147 1

原创 机器学习有监督算法

监督学习主要包括和两种类型。分类是一种监督学习的任务,它的目标是将输入数据分到不同的类别中。常见的分类算法包括决策树、朴素贝叶斯、支持向量机、逻辑回归等。回归是一种监督学习的任务,它的目标是预测一个连续的数值输出。常见的回归算法包括线性回归、多项式回归、岭回归、Lasso回归等。

2023-09-13 16:10:11 701 1

原创 K最邻近算法(KNN)

Knn全称是K-Nearest Neighbor,从名称中可以看出这个算法与最邻近有关,既能用于回归问题,也能用于分类问题。KNN根据数据点之间的距离来做分类(回归)。

2023-09-03 14:57:22 121

原创 python数据预处理

数据预处理的主要任务包括数据清洗,数据集成,数据变换和数据规约。

2023-09-02 19:38:55 70 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除