机器学习
文章平均质量分 93
自主推导机器学习的算法,并能以案例驱动应用机器学习建模。
Training.L
我思故我在
展开
-
【白话数据分析】距离度量的相似度计算
在数据分析和数据挖掘中,经常需要数值化样本个体间差异的大小,进而评价个体的相似度或者进行分类。比如统计分析中的相关性分析,数据挖掘中进行的KNN分类与K-means聚类,还有推荐系统算法中搜索引擎的物品推荐。为了能由简及易的深刻阐述样本相似度的基本原理和应用,我们从一个基本的例子出发,并且结合程序计算,结合图像直观区分各个相似之间的差异。由距离引出的相似度欧几里得距离曼哈顿距离闵可夫斯基距离余弦相似度杰卡德相似度皮尔逊相关系数样本特征1特征2特征3特征4.原创 2021-02-16 14:06:09 · 2067 阅读 · 0 评论 -
【机器学习】Adaboost算法原理与数学推导
Adaboost算法原理一、从零推导adaboost二、 adaboostadaboostadaboost的特性:概述:adaboostadaboostadaboost是集成学习的一种, 意思是建立多个弱分类器, 然后用这些弱分类器的线性加权组合来形成一个强分类器. 什么是弱分类器呢, 就是只比胡猜稍微好一点的分类器, 训练这些弱分类器是一个迭代的过程, 在这个过程里, 下一个弱分类器总是更加关注上一个弱分类器没有分好的数据样本, 以弥补之前弱分类器的不足, adaboostadaboostadaboos原创 2021-02-10 19:11:05 · 422 阅读 · 0 评论 -
【机器学习】白话朴素贝叶斯算法
朴素贝叶斯一、条件概率二、贝叶斯公式三、贝叶斯公式的应用四、朴素贝叶斯代码 朴素贝叶斯算法依据概率论中贝叶斯定理建立的模型,前提假设是各个特征之间相互独立(这也是**“朴素”的含义**),因为实际场景中多个特征一般存在相关性,所以针对特征之间存在强相关性的场景往往会分类不准。朴素贝叶斯算法最常见的应用场景是垃圾邮件分类。一、条件概率 定义:原创 2021-02-03 18:36:09 · 998 阅读 · 0 评论 -
一文彻底读懂【极大似然估计】
极大似然估计(Maximum Likelihood Estimate)一、背景知识二、从概率模型理解极大似然估计三、极大似然估计的理论原理四、应用场景一、背景知识1822年首先由德国数学家高斯(C. F. Gauss)在处理正态分布时首次提出;1921年,英国统计学家罗纳德·费希尔(R. A. Fisher)证明其相关性质,得到广泛应用,数学史将其归功于费希尔。研究问题本质背后的深刻原因在于,现实世界本身就是不确定的,人类的观察能力是有局限性的,就是利用已知的样本信息,反向推导最有可能(即最大概率原创 2021-02-01 14:24:28 · 14604 阅读 · 6 评论 -
【西瓜书】决策树ID3算法
这里写自定义目录标题决策树原理解释ID3算法算法实现决策树原理解释 决策树模型是很多集成模型的基础,比如:XGBoost、Adaboost 和随机森林等。决策树算法包括了 ID3 算法、C4.5 以及 Cart 算法,这三类算法最主要的区别在于其特征选择准则的不同,其中 ID3 算法选择特征的依据是信息增益、C4.5是信息增益率,而 Cart 则是采用的基尼系数。  原创 2020-12-07 16:56:34 · 3577 阅读 · 3 评论