机器学习
文章平均质量分 54
我哪知道啊¿
一名普普通通的魔都在校大学生,欢迎大家一起来探讨计算机学科知识
阶段性目标:校招时拿到大厂offer,主攻java。
展开
-
机器学习入门之单层感知器
单层感知机原创 2022-06-02 19:17:37 · 160 阅读 · 0 评论 -
机器学习入门之决策树分类
决策树比较适合分析离散数据,如果是连续数据要先转成离散数据再做分析一个小栗子在这个例子中,我们通过一个人的各项属性来推断他是否会买电脑在此基础上构建出的决策树信息熵信息熵越大,代表事物的不确定性越高下面是一个计算信息熵的例子ID3算法决策树会选择最大化信息增益来对结点进行分类下面是信息增益的计算,其中第一个式子就是信息熵还是同样的例子,此时参数InfoA中的A=age,我们可以看到,14条数据中有五条age为youth,四条为middle_aged,五条为senio.原创 2022-05-30 14:27:12 · 470 阅读 · 0 评论 -
机器学习入门之PCA降维
概念数据降维,通俗的来说,就是把多维的数据降维成低维的数据,比如说,通过某种函数,将二位空间内的点映射到一根直线上,实现二维降到一维。栗子上图中,一个国家有多个维度的数据,我们希望通过降维,使数据的可视化更加简单,下面是降维后的结果注意,图中的两列并不是抽取了原图中某两列,而是我们根据降维算法后得出的某种特殊值。降维分析找到数据最重要的方向(方差最大的方向)如图所示,黑色的叉是数据点,我们将数据点依次投影到红线和紫线上,可以直观的看出红线的方差要比紫线大。...原创 2022-05-25 12:24:36 · 231 阅读 · 0 评论 -
机器学习入门之贝叶斯算法
贝叶斯公式朴素贝叶斯多项式模型原创 2022-05-24 10:32:36 · 226 阅读 · 0 评论 -
机器学习入门之KNN算法
KNN算法的目的KNN算法,即给定一定数量的已知类别,并以此作为依据,根据未知实例与k个最近的已知类别中哪个已知类别占主导,来预估未知实例的类别。KNN算法的大致流程确定k的值(即几个距离未知样本最近的已知样本)计算未知样本与所有已知样本的距离选择k个最近的已知样本根据少数服从多数,把未知样本归类于k个最近已知样本中最多数的类别一个小小的栗子假设我们要建立一个模型,用来估测未知的那个电影,是属于爱情片还是打斗片,下面是已知数据建立模型画出图像黑点即我们要预测的对象,最红原创 2022-05-17 11:24:45 · 359 阅读 · 0 评论