- 博客(5)
- 收藏
- 关注
原创 机器学习---朴素贝叶斯
朴素贝叶斯算法的核心思想是通过考虑特征概率来预测分类,即对于给出的待分类样本,求解在此样本出现的条件下各个类别出现的概率,哪个最大,就认为此待分类样本属于哪个类别。朴素贝叶斯是一种分类算法,经常被用于文本分类,它的输出结果是某个样本属于某个类别的概率。之所以被称为“朴素”,主要在于它做出了一个假设,即每个特征是相互独立的。朴素贝叶斯算法的核心假设是特征之间的独立性,也就是说,每个特征对于分类结果的贡献是相互独立的。尽管这个假设在现实世界中往往不成立,但朴素贝叶斯算法仍然在许多实际问题中表现良好。
2024-05-13 18:57:33 699
原创 机器学习-决策树
是⼀种树形结构,本质是⼀颗由多个判断节点组成的树其中每个内部节点表示⼀个属性上的判断,每个分⽀代表⼀个判断结果的输出,最后每个叶节点代表⼀种分类结果。决策树分类原理信息熵首先先从熵开始理解1从信息的完整性上进⾏的描述当系统的有序状态⼀致时,数据越集中的地⽅熵值越⼩,数据越分散的地⽅熵值越⼤。2从信息的有序性上进⾏的描述当数据量⼀致时系统越有序,熵值越低;系统越混乱或者分散,熵值越⾼。所以信息熵是度量样本集合纯度最常⽤的⼀种指标。信息熵公式:D为样本的所有数量,C。
2024-04-30 12:12:39 637
原创 人工智能-常见模型评估(基于sklearn实现)
模型评估是模型开发过程不可或缺的一部分。它有助于发现表达数据的最佳模型和所选模型将来工作的性能如何。按照数据集的目标值不同,可以把模型评估分为分类模型评估和回归模型评估。
2024-04-15 20:48:04 643
原创 不使用sklearn新手都能实现的KNN算法
KNN算法:k最近邻(k-Nearest Ne ighbor)算法是比较简单的机器学习算法。它采用测量不同特征值之间的距离方法进行分类。如果一个样本在特征空间中的多个最近邻(最相似〉的样本中的大多数都属于某一个类别,则该样本也属于这个类别。欧几里得距离:衡量的是多维空间中两点之间的绝对距离,表达式如下 归一化:归一化是一种数据处理方式,能将数据经过处理
2024-03-27 20:11:08 752
原创 Anaconda安装图文教程
Anaconda的conda工具简化了跨操作系统的包和环境管理,它提供了一个灵活的数据科学平台,具有全面的包管理和创建独立项目环境的能力。Anaconda广泛的开源包分发和简单的环境管理能够让我们快速部署环境,进行包管理与环境管理。
2024-03-06 21:25:26 493
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人