machinelearning
文章平均质量分 96
1
Hermokrates
当你觉得学习难,学不进去的时候,想想你身后『强大的祖国』
展开
-
逻辑回归算法推理与实现
逻辑回归通常用于分类算法,例如预测某事是 还是 (二元分类)。例如,对电子邮件进行分类,该算法将使用电子邮件中的单词作为特征,并据此预测电子邮件是否为垃圾邮件。用数学来讲就是指,假设因变量是 Y,而自变量集是 X,那么逻辑回归将预测因变量 P(Y=1)P(Y=1)P(Y=1) 作为自变量集 X 的函数。逻辑回归性能在线性分类中是最好的,其核心为基于样本属于某个类别的概率。这里的概率必须是连续的并且在 之间(有界)。它依赖于阈值函数来做出称为 或 函数决定的。学好逻辑回归,需要了解逻辑回归的概念、优势原创 2022-06-07 17:40:09 · 1206 阅读 · 0 评论 -
决策树算法的推理与实现
决策树的概念 略信息增益 是用于训练决策树的指标。具体来说,是指这些指标衡量拆分的质量。通俗来说是通过根据随机变量的给定值拆分数据集来衡量熵。通过描述一个事件是否"惊讶",通常低概率事件更令人惊讶,因此具有更大的信息量。而具有相同可能性的事件的概率分布更"惊讶"并且具有更大的熵。定义:熵 entropy是一组例子中杂质、无序或不确定性的度量。熵控制决策树如何决定拆分数据。它实际上影响了决策树如何绘制边界。熵的计算公式为:E=−∑i=1i(pi×log2(pi))E=-\sum^i_{i=1}(p_i\t原创 2022-06-03 19:11:31 · 381 阅读 · 0 评论 -
朴素贝叶斯算法的推理与实现
什么是naive bayes朴素贝叶斯 naive bayes,是一种概率类的机器学习算法,主要用于解决分类问题为什么被称为朴素贝叶斯?为什么被称为朴素,难道仅仅是因为贝叶斯很天真吗?实际上是因为,朴素贝叶斯会假设数据属性之间具有很强的的独立性。即该模型中的所有属性彼此之间都是独立的,改变一个属性的值,不会直接影响或改变算法中其他的属性的值贝叶斯定理了解朴素贝叶斯之前,需要掌握一些概念才可继续条件概率 Conditional probability:在另一个事件已经发生的情况下,另外一个时间发原创 2022-05-06 19:56:44 · 919 阅读 · 0 评论 -
KNN算法推理与实现
文章目录Overview如何工作KNN算法要执行的步骤影响KNN算法性能的因素如何计算距离汉明距离欧几里得距离曼哈顿距离闵可夫斯基距离OverviewK近邻值算法 KNN (K — Nearest Neighbors) 是一种机器学习中的分类算法;K-NN是一种非参数的惰性学习算法。非参数意味着没有对基础数据分布的假设,即模型结构是从数据集确定的。它被称为惰性算法的原因是,因为它**不需要任何训练数据点来生成模型。**所有训练数据都用于测试阶段,这使得训练更快,测试阶段更慢且成本更高。如何工作KN原创 2022-04-22 18:04:31 · 2267 阅读 · 1 评论