机器学习
文章平均质量分 84
alstonlou
这个作者很懒,什么都没留下…
展开
-
机器学习-朴素贝叶斯【手撕】
在许多分类算法应用中,特征和标签之间的关系并非是决定性的。比如说,我们想预测一个人究竟是否会在泰坦尼克号海难中生存下来,那我们可以建一棵决策树来学习我们的训练集。在训练中,其中一个人的特征为:30岁,男,普通舱,他最后在泰坦尼克号海难中去世了。当我们测试的时候,我们发现有另一个人的特征也为:30岁,男,普通舱。基于在训练集中的学习,我们的决策树必然会给这个人打上标签:去世。然而这个人的真实情况一定是去世了吗?并非如此。也许这个人是心脏病患者,得到了上救生艇的优先权。原创 2024-02-06 09:19:49 · 1282 阅读 · 2 评论 -
机器学习-线性回归【手撕】
回归是一种应用广泛的预测建模技术,这种技术的核心在于预测的结果是连续型变量。决策树,随机森林,支持向量机的分类器等分类算法的预测标签是分类变量,多以{0,1}来表示,而无监督学习算法比如PCA,KMeans的目标根本不是求解出标签,注意加以区别。原创 2024-02-02 14:26:30 · 1446 阅读 · 0 评论 -
机器学习-聚类算法Kmeans【手撕】
在训练时,使用没有标签的数据集进行训练,希望在没有标签的数据里面可以发现潜在的一些结构。其中使用范围较广的是,聚类算法。聚类算法的目的是将数据划分成有意义或有用的组(或簇)。这种划分可以基于我们的业务需求或建模需求来完成,也可以单纯地帮助我们探索数据的自然结构和分布。比如在商业中,如果我们手头有大量 的当前和潜在客户的信息,我们可以使用聚类将客户划分为若干组,以便进一步分析和开展营销活动,最有名的客户价值判断模型RFM,就常常和聚类分析共同使用。原创 2024-01-31 19:45:10 · 1263 阅读 · 4 评论 -
机器学习-逻辑回归【手撕】
SigmoidSigmoidSigmoid# 初始化权重和偏置# 梯度下降。原创 2024-01-29 08:53:26 · 1357 阅读 · 1 评论 -
机器学习-PCA降维【手撕】
降维算法中的”降维“,指的是降低特征矩阵中特征的数量,其目的是为了让算法运算更快,效果更好,同时可以方便数据可视化。过高的维度特征维度的特征矩阵无法通过可视化,数据的性质也就比较难理解。其中主要用到的降维方法为PCA和SVD。原创 2024-01-23 20:36:35 · 1289 阅读 · 1 评论 -
机器学习-随机森林【手撕】
集成学习不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果,基本上现在的所有机器学习都能看到集成学习的身影。原创 2024-01-22 19:46:37 · 759 阅读 · 1 评论 -
机器学习-决策树【手撕】
决策树是一个预测模型,它代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。原创 2024-01-20 21:11:40 · 2408 阅读 · 1 评论