机器学习
文章平均质量分 80
komjay
这个作者很懒,什么都没留下…
展开
-
机器学习 (第9章 概率图模型)
对于一个很大的贝叶斯网络,我们需要有一个很高效的方法的快速辨别两个变量之间是不是独立的,但我们这里考虑条件独立性,条件独立性不同于独立性,条件独立性,必须要在某一条件下,考虑另外两个变量之间的独立性。在贝叶斯网络,其联合概率计算是由图来定义的,如下图1.所展示,而如果没有贝叶斯网络,我们无法了解各个变量之间是否有联系,就认为都有联系,于是列出的联合概率公式为0.所示。概率图模型基于图,而图这种数据结果分为两种:有向图和无向图,针对有向(无环)图结构,实现的是贝叶斯网络,针对无向图,则为马尔可夫随机场。原创 2023-12-25 13:28:31 · 1217 阅读 · 0 评论 -
机器学习(第8章 信息论模型)
要注意,信息量用于描述是一个变量取值的,比如:北京明天天气=下雪。而信息熵用于描述一个变量的,例如北京明天天气。之所以说微分熵不是信息熵,是因为信息熵应该计算概率值,而微分熵公式中的“概率值”并不是概率值,其是连续概率分布上的取值。真正的概率值是p(x)*δx,其中δx是一个极小的值。而真正的连续概率分布的信息熵推导如下:如红字所写,微分熵可以用于对比,但不能等价于信息熵。(红字错写成信息量了)重点学习熵相关定义和最大熵模型的优化过程。原创 2023-12-18 22:18:19 · 85 阅读 · 0 评论 -
机器学习(第7章 降维与特征提取)
总结一下:(1)穷举法无法处理维度大的情况,于是提出(2)单独最优特征最优组合,但这种方法不考虑组合最优,为了改进,提出了(3)SFS和(5)SBS,而为了每次选取是更优的组合,提出(4)GSFS和(6)GSBS,而改进它们一旦决策就不修改的问题,提出了(7)L-R法和(8)广义L-R法。从数据的角度出发,数据的特征并不是全都有用的,总会存在没用的特征,消除这些特征是有必要的,是利于模型去训练的。一般来说,我们使用(1)的框架,如果我们的模型很大,对精度要求高,我们可以使用(2)。原创 2023-12-04 19:59:57 · 274 阅读 · 0 评论 -
机器学习(第6章 聚类分析)
作为一种无监督机器学习的方法,其优势在于模型小、速度快,属于对数据预处理的一种方法:即将数据类似的样本汇聚在一起。这样有助于后续任务的进行。具体描述如下:在不同的学科中,聚类算法有不同的称呼:在聚类任务中,必须保证以下三个条件:(1)每个类别一定都有样本点、(2)所有样本点必属于某一类、(3)某个样本点只能属于一类。原创 2023-12-04 18:10:47 · 54 阅读 · 0 评论 -
机器学习 (第五章 回归分析)
回归任务的目标是,对于一系列数据(x,y),我们设计出一个模型f,使得f(x)=y。这不就是分类任务嘛?其实不一样,数据中的y不再是两类或者多类,而是有一定的规律性。而回归任务主要做的,其实是用一条曲线去串起这一系列数据。如下所示:当然,在二维中,这是一条曲线,在高维中,他就是一个超平面,训练数据的点则会落在这个超平面上。而回归问题的数学定义如下:而将分类问题与回归问题进行对比:实际上分类也可以看成是一个分类问题:而在实际应用中,回归模型比分类模型更弱:(1)手段有限,应用的场景太少。原创 2023-11-18 15:34:31 · 46 阅读 · 0 评论 -
机器学习 (第4章 非线性分类)
1.显然地,我们之前学习的线性分类法不可能将所有问题进行分类,而实际上,有许多问题是有明显的非线性的决策面进行分类,如下图:2.于是乎,提出非线性分类方法,按思想原理,可分为两种:线性拓展的方法实际上并不对原判别函数的参数进行变动,而是将输入x进行一定的变换,比如二次方化,幂函数化。而我们主要学习非线性思想的几种方法,且这几种方法并不是都是统一的思想原理。原创 2023-10-31 15:31:30 · 252 阅读 · 1 评论 -
机器学习 (第3章 线性分类)
1.了解机器学习中的一些基础知识。2.xxx。原创 2023-10-11 14:23:40 · 58 阅读 · 1 评论 -
机器学习(第2章 贝叶斯理论与应用)
1.了解贝叶斯公式。2.了解贝叶斯去决策相关函数和过程。3.根据例子理解朴素贝叶斯分类器在离散变量和连续变量中的设计。原创 2023-09-27 14:23:31 · 346 阅读 · 1 评论 -
机器学习 (第1章 介绍)
1.。原因:(1)图灵测试问题无法全面;(2)人与人之间的知识差距尚且很大,如何通过回答去区分人与机器;(3)图灵测试的判定标准不明确;(4)AI不需要拥有一些人思维上的一些缺点。2.(1)孕育期(~1956):图灵测试提出(1950)(2)推理期(1956~1965):逻辑理论家程序(1956)、Lisp语言(1960)(3)知识期(1965~1983):DENDRAL(1965)和MYCIN(1972)(4)学习期(1983~2006):统计机器学习主导,SVM。原创 2023-09-16 14:43:35 · 43 阅读 · 1 评论 -
机器学习 (第0课 大纲)
学习目标课程大纲原创 2023-09-16 13:48:00 · 32 阅读 · 1 评论