数据挖掘
文章平均质量分 96
数据挖掘 data-mining
zygswo
不积跬步,无以至千里
展开
-
程序猿成长之路之数据挖掘篇——决策树分类算法(1)——信息熵和信息增益
决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。原创 2024-06-22 17:11:55 · 1479 阅读 · 1 评论 -
程序猿成长之路之数据挖掘篇——距离公式介绍
用自己的话来说距离公式就是判断两个属性(参数)相似度的度量公式原创 2024-05-13 09:01:39 · 877 阅读 · 0 评论 -
程序猿成长之路之数据挖掘篇——朴素贝叶斯
什么是朴素贝叶斯官话:朴素贝叶斯(naive Bayes)算法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立假设学习输入输出的联合概率分布。然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。不同于其他分类器,朴素贝叶斯是一种基于概率理论的分类算法;用个人的话来说:朴素贝叶斯就是基于概率大小进行分类判断的一种方式。就如同上面的西瓜分类,好瓜概率大就认定为是好瓜,否则就认定为坏瓜。先验概率、似然概率和后验概率。原创 2024-04-23 11:14:27 · 1656 阅读 · 4 评论 -
程序猿成长之路之数据挖掘篇——频繁项集挖掘介绍
频繁项集挖掘可以说是数据挖掘中的重点,下面我们来分析以下频繁项集挖掘的过程和目标原创 2024-04-07 11:00:53 · 1243 阅读 · 0 评论 -
程序猿成长之路之数据挖掘篇——数据挖掘介绍
按照话术来说,数据挖掘就是数据中的知识发现。原创 2024-03-26 16:21:31 · 1081 阅读 · 1 评论