自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

了解➔熟悉➔掌握➔精通

为之,则难者亦易矣;不为,则易者亦难矣。

  • 博客(1309)
  • 收藏
  • 关注

原创 深入详解Java动态代理

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​动态代理在Java中有着广泛的应用,比如Spring AOP、Hibernate数据查询、测试框架的后端mock、RPC远程调用、Java注解对象获取、日志、用户鉴权、全局性异常处理、性能监控,甚至事务处理等。本文主要介绍Java中两种常见的动态代理方式:JDK原生动态代理和CGLIB动态代理。

2025-10-27 14:23:49 1321 1

原创 深入详解Java反射机制

反射(Reflection)是 Java 在运行时(Run time)可以访问、检测和修改它本身状态或行为的一种能力,它允许运行中的 Java 程序获取自身的信息,并且可以操作类或对象的内部属性。Class 类介绍:Java虚拟机为每个类型管理一个Class对象,包含了与类有关的信息,当通过 javac 编译Java类文件时,生成的同名 .class 文件保存着该类的 Class 对象,JVM 加载一个类即是加载该 .class 文件。Class和。

2025-10-27 10:57:38 923 1

原创 MySQL的索引是如何实现的

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击http://www.captainbed.netMySQL中索引分三类:B+树索引、Hash索引、全文索引。InnoDB存储引擎中用的是B+树索引。要介绍B+树索引,不得不提二叉查找树、平衡二叉树和B树这三种数据结构。B+树是从它们三个演化来的。二叉查找树:图中为user表建立了一个二叉查找树的索引。节点中存储了键(key)和数据(data)。数据对应user表中的行数据。如果查找id=12

2022-01-04 21:39:17 38095 21

原创 MySQL日志-RedoLog、UndoLog与BinLog

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请点击http://www.captainbed.netRedoLogRedoLog是InnoDB存储引擎层的日志,又称重做日志,用于记录事务操作的变化,记录的是数据修改之后的值,不管事务是否提交都会记录下来。在实例和介质失败(Media Failure)时,RedoLog文件就能派上用场,如数据库掉电,InnoDB存储引擎会使用RedoLog恢复到掉电前的时刻,以此来保证数据的完整性。在一条更新语句进行执

2021-12-12 21:30:47 512

原创 Java-ThreadLocal(看这一篇就够了)

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请点击http://www.captainbed.net1、什么是ThreadLocalThreadLocal class provides thread-local variables. These variables differ from their normal counterparts in that each thread that accesses one (via its get or set

2020-12-17 15:13:09 23040 2

原创 Java-通俗易懂地理解HashMap的原理

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请点击http://www.captainbed.net一、HashMap的节点HashMap是一个集合,键值对的集合,源码中每个节点用Node<K,V>表示。 static class Node<K,V> implements Map.Entry<K,V> { final int hash; final K key;

2020-11-25 18:27:44 21881

原创 Java-理解volatile关键字(看这一篇就够了)

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请点击http://www.captainbed.net一、内存模型如果一个变量在多个CPU中都存在缓存(一般在多线程编程时才会出现),那么就可能出现缓存不一致的问题。缓存不一致性问题通常有以下2种解决方法:1、通过在总线加LOCK锁的方式CPU和其他部件进行通信都是通过总线来进行的,当总线上发出了LCOK锁的信号,那么只有等待代码完全执行完毕之后,其他CPU才能从变量所在的内存读取变量,然后进行相

2020-08-10 16:22:32 22016

原创 机器学习40讲-36:确定近似推断变分贝叶斯

确定性近似的典型代表是变分贝叶斯推断(variationalBayesian inference),它解决的问题是对隐变量$\bfy$关于已知输入$\bf x$的后验概率$p({\bfy} | {\bf x})$的近似,近似的方式是利用最优的近似概率分布$q({\bfy})$来逼近$p({\bfy} | {\bf x})$。优化的目的是用简单的、容易计算的分布$q({\bfy})$来拟合复杂的、不容易计算的后验分布$p({\bfy} | {\bf x})$,优化的对象是变分下界。

2026-06-03 14:55:01 229

原创 机器学习40讲-35:精确推断变量消除及其拓展

fo$与$do$的关系已经由上面计算出的新因子所定义,与$lo$的关系则是纯粹的条件概率,两者结合可以表示为另一个新因子$$ \psi_2 (do, lo) = \sum\limits_{fo} \psi_1 (fo, do) p(fo) p(lo | fo) $$变量$lo$只出现在新因子$\psi_2$中,消除这个变量的结果就是只和变量$do$有关的因子$\psi_3(do) = \sum_{lo} \psi_2 (do, lo)$求和。从运算效率的角度对变量消去加以改进,得到的就是置信传播算法。

2026-06-02 11:04:13 251

原创 机器学习40讲-34:连续序列化模型线性动态系统

隐藏状态变量初始的取值${\bfX}^{(0)}$也满足高斯分布,其概率密度可以写成$$ P({\bfX}^{(0)}) = \mathscr{N} ({\bfX}^{(0)}| \boldsymbol\mu_0, V_0) $$如果将线性动态系统放在状态空间表象(state space representation)下观察,上面的条件概率就可以改写成状态方程的形式$$ {\bfX}^{(n)} = {\bfA}{\bfX}^{(n - 1)} + {\bfw} $$

2026-06-01 15:37:06 155

原创 机器学习40讲-33:序列化建模隐马尔可夫模型

在隐马尔可夫模型中,罐子表示的是由概率模型生成的不可观测的随机序列,每个罐子都代表了系统的一种状态,所以这个隐藏的序列叫作状态序列(statesequence),也就是上图中圆圈的部分。这里的上层分布起到的就是前面无信息先验的作用,可以决定哪些状态更容易出现,它的浓度参数决定了状态的密度。假设所有可能的状态$q_i$总共有$N$个,所有可能的观测结果$v_j$总共有$M$个,所有抽取出的状态结果$i_t$构成长度为$T$的状态序列,所有状态生成的观测结果$o_t$则构成长度为$T$的观测序列。

2026-06-01 14:49:20 252

原创 机器学习40讲-32:从有限到无限高斯过程

要理解协方差函数在高斯过程中的作用,首先要明确高斯过程的一个主要特点,那就是它建模的对象不是自变量$\bf x$和因变量$y$之间的关系,而是不同的因变量$y$和$y’$之间的关系,正是这种思想决定了高斯过程的非参数特性。如果要将上面的参数化过程过渡为完全的非参数化过程,就要摆脱对于参数$\bfw$的依赖,最直接的方法是不定义$\bfw$的先验,而是直接定义在函数空间上的输出$y({\bf x})$的先验,也就是给出$y({\bf x})$取不同形式的概率。但在多元高斯分布中,变量的数目依然是有限的。

2026-06-01 14:29:50 112

原创 机器学习40讲-31:建模连续分布高斯网络

在这个顺连结构中,$X_1$和$X_3$之间并不存在直接的作用,而是以$X_2$作为媒介和中转。“如果一个线性高斯网络具有顺连结构$X_1 \rightarrowX_2 \rightarrowX_3$,其中$X_1$的概率密度${\mathscr N}(1, 4)$,已知$X_1$时$X_2$的条件概率密度为${\mathscr N}(0.5X_1 - 3.5, 4)$,已知$X_2$时$X_3$的条件概率密度为${\mathscr N}(-X_2 + 1, 3)$,试求解整个网络所表示的联合分布。

2026-05-25 21:00:59 223

原创 机器学习40讲-30:无向图模型马尔可夫随机场

在上面的例子中,如果要计算四个随机变量分别等于$a^0, b^0,c^1, d^1$的概率,就需要先将反映它们之间的依赖关系的因子相乘$$ \phi_1(a^0, b^0) \cdot \phi_2(b^0,c^1) \cdot \phi_3(c^1, d^1) \cdot \phi_4(d^1,a^0) = 30 \times 1 \times 1 \times 1 = 30 $$在计算中需要注意的是,在两个因子相乘时,将这两个因子联系起来的中间变量的取值必须是匹配的。上面求出的只是一种可能出现的取值。

2026-05-19 13:57:53 278

原创 机器学习40讲-29:有向图模型贝叶斯网络

在上面的例子中,随机变量的数目,也就是结点的数目是5个,每个随机变量又都只有2种可能的取值。不严谨地说,在给定一些证据(evidence),也就是某些结点的取值固定时,如果一个结点的变化会影响到另一个结点的变化,那它们就是$d$连通的($d$-connected),它们之间存在着$d$连接路径($d$-connecting path)。将所有结点分成互斥的若干个子集,如果在给定集合$X$的条件下,集合$A$中的任何变量都和集合$B$条件独立,那么满足这一条件的最小集合$X$就是集合$A$的马尔可夫毯。

2026-05-19 11:42:54 322

原创 机器学习40讲-28:最简单的概率图朴素贝叶斯

从今天起,我们将进入概率图模型的模块,以贝叶斯的角度重新审视机器学习。在机器学习任务中,输入和输出之间并不是简单的一对一的决定关系,两者之间通常存在着一些可见或不可见的中间变量。要计算输出变量的概率分布,就得把这些中间变量纳入到建模的框架之中。要简洁明快地表达多个变量之间的复杂的相关关系,图模型无疑是理想的选择。将图模型和概率模型结合起来,就是这个模块的主题——概率图模型(probabilistic graphical model)。在“人工智能基础课”中,我曾用简短的篇幅粗略地介绍过概率图模型的概念和分类

2026-05-18 17:59:08 453

原创 机器学习40讲-总结课:机器学习的模型体系

结构化局部模型的代表是核函数,虽然它原本的目的不在于此,却在事实上起到了局部化的作用。这里我用参数的非线性化来指代属性不变但参数改变的模型,但由于参数本身是常量而非变量,因此参数的非线性化是以自适应调整的方式体现的。局部化是对数据样本所在的特征空间的切割,可分布式表示却是对特征空间的重组,将原来单个的数据点变出了多个分身,分别作为对数据不同角度的观察结果。一手遮天的全局特性限制了模型的灵活性,改进的方法在于将它改造成若干个局部模型的组合,其演进的过程可以描述为“结构化局部——非结构化局部——分布式表示”。

2026-05-17 18:03:20 250

原创 机器学习40讲-27:万能模型梯度提升与随机森林

在集成方法中,假定最终的输出结果$f(x)$是每个基学习器单独输出的线性组合$\sum_{i=1}^N w_if_i(x)$,其中线性系数全部为正且和为1,那么每个基学习器的分歧就可以表示为$$ a_i(x) = [f(x) - f_i(x)] ^ 2 $$集成模型的分歧是所有基学习器的分歧的线性组合$$ a(x) = \sum\limits_{i= 1}^N w_ia_i(x) $$这个表达式可以看成是所有独立输出对加权平均求出的加权方差。通过增加个体的方差来减小集体的方差,这就是集成学习的奇妙之处。

2026-05-16 20:25:48 296

原创 机器学习40讲-26:集成化处理Boosting与Bagging

每当一个新的弱学习器加入后,数据的权重都会被重新分配(reweighting),被错误分类的样本占据更大的权重,被正确分类样本的权重则被相应地削减,这保证了未来的弱学习器会更多地以前车之覆作为后车之鉴。某种意义上说,堆叠法的训练数据不是原始的训练数据集,而是不同基学习器在训练数据集上的结果,起到的是模型平均(modelaveraging)的作用,提升法和装袋法都可以看成它的特例。需要注意的是,装袋法并没有降低偏差的效果,也就没法提升预测的准确性,因此在选择基学习器时,应当以偏差较小的优先。

2026-05-14 20:15:26 222

原创 机器学习40讲-25:基于特征的区域划分树模型

显然,$T$的作用是对目标函数的正则化。在从整体到局部的过渡中,回归树的操作和之前介绍过的回归样条方法一脉相承,采用的都是“分段函数”的思路,但两者的区别在于回归树对特征空间执行的是递归式划分(recursive partitioning)。可以看到,在一维的情形下,回归树其实是分段的常数函数,只不过不同分段之间的分界点并不是人为指定,而是通过方差下降的方法计算出来的。因变量的相似性决定了被划分到同一组的数据在输出上的差别较小,自变量的相异性则决定了被划分到不同组的数据在某一个输入属性上的差别较大。

2026-05-14 19:53:46 154

原创 机器学习40讲-24:深度编解码表示学习

在卷积层和下采样层的迭代过程中,低层次的特征不断组合成高层次的特征,数字图像的表示方式也从原始的像素集合变成卷积得到的特征组合,这两个层也就构成了卷积神经网络的编码器。在自编码器最初的设计中,编码器的任务是生成参数矩阵${\bfW}_C$,用来计算输入数据$\bfX$的码字向量,解码器的任务是生成参数矩阵${\bfW}_D$,用来重构的码字向量所对应的初始数据$\tilde{\bfX}$。从编解码的全过程来看,如果要构造出有效的表示,自编码器的输入和输出就应该是近似相等的,那它学习的对象是个恒等函数。

2026-05-14 16:41:43 167

原创 机器学习40讲-23:层次化的神经网络深度学习

下面的这个例子来自于约书亚·本吉奥(Yoshua Bengio)等人的大作《深度学习》(Deep Learning),在识别这张图片时,理想的算法应该能够将由像素的灰度值所组成的数组输出“女人”这样的标签,识别的过程就是逐层提取模式的过程。算法的第一层可以根据灰度的空间分布提取出诸如边缘这类在较小的几何尺度上保持不变性的低层次特征,第二层进一步从边缘的组合中抽象出角度和弧度等高级的形状特征,第三层再根据形状的组合抽象出面部和身体等器官的轮廓,最后将这些器官的轮廓组合成关于“女人”的潜在模式。

2026-05-14 16:21:51 391

原创 机器学习40讲-22:自适应的基函数神经网络

网络输出的分类结果$t$满足两点分布,它关于数据$\bf x$和参数$\bfw$的似然概率可以写成$$ p(t | {\bf x}, {\bfw}) = y({\bf x}, {\bfw})^t [1 - y({\bf x}, {\bfw})] ^ {1 - t} $$其中$y({\bf x}, {\bfw})$是输出层激活函数为对数几率函数时的输出,可以视为$\bf x$归属于正类的条件概率。在用于分类的神经网络中,先验假设就是参数$\bfw$的概率分布,这个分布通常被处理成零均值的高斯分布。

2026-05-14 15:15:25 125

原创 机器学习40讲-21:基函数扩展属性的非线性化

充分利用关于基函数的灵活性,就可以将线性回归的表达式推广成$$ y =\beta_0 + \beta_1\phi(x_1) + \beta_2\phi(x_2) + \cdots + \beta_n\phi(x_n) $$显然,当$\phi(\cdot)$是个非线性的函数时,回归结果实际上就是经过非线性变换的输入属性的线性组合,因变量和自变量之间也就建立起了非线性的关系。在最原始的线性回归中,基函数的形式是恒等函数,因此这样的模型无论对属性$x_i$还是对系数$\beta_i$都是线性的。

2026-05-14 12:02:58 218

原创 机器学习40讲-20:基于距离的学习聚类与度量学习

但近邻点是以内收的形式影响未知的数据,所有近邻点按照一定的规则共同决定处于中心的未知数据的类别。如果聚类的任务是将$N$个数据点聚类成为$K$个簇,那它的目标函数就可以写成$$ J = \sum\limits_{n = 1}^N \sum\limits_{k = 1}^K r_{nk} || x_n - \mu_k || ^ 2 $$其中$x_n$是数据点,$\mu_k$是第k个簇的中心,也就是簇中所有数据点的均值,$r_{nk}$是数据点和簇之间的关系:当$x_n$被归类到第$k$个簇时为1,否则为0。

2026-05-13 21:16:41 213

原创 机器学习40讲-19:非参数化的局部模型K近邻

在直方图上,第$i$个子区间上的概率可以表示成$$ p_i= \dfrac{n_i}{N\Delta} $$其中$n_i$是落在这个子区间内的样本数,$N$是样本容量,$\Delta$是每个子区间的宽度,它决定了直方图的分辨率。在高维空间中,如果将数据$\bfx$的局部结构定义为$R$,那么其概率密度就可以表示为$$ p({\bf x}) = \dfrac{K}{NV} $$其中$K$表示$R$中的数据点数目,$V$表示$R$的体积,它们都是不确定的量。下图是$k$近邻算法的一个简单的例子。

2026-05-13 16:11:59 229

原创 机器学习40讲-18:从全局到局部核技巧

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程https://www.captainai.net/troubleshooter俗话说得好:“支持向量机有三宝,间隔对偶核技巧”。在上一篇文章中我和你分享了间隔这个核心概念,今天就来看看对偶和核技巧的使用。对偶性主要应用在最优决策边界的求解中,其逻辑比较简单。但在介绍核技巧时,会先后涉及核函数、核方法、核技巧这些近似的概念。虽然从名字上看,它们都是“核”字辈的兄弟,但是在含义和用途上却不能一概而论,因

2026-05-12 21:27:10 281

原创 机器学习40讲-17:几何角度看分类支持向量机

在上面的二分类问题中,边界$H_2$过于靠近一些训练数据,那么这些靠近边界的数据受噪声或干扰影响时,得到的真实数据就更容易从一个类别跳到另外一个类别,导致分类的错误和泛化性能的下降。在旋转的过程中,两个不动点之间的欧氏距离是不变的,但两条线的斜率一直在改变,因此它们之间的距离也会不断变化。如此看来,能够入你法眼的停火线就只有$H_3$了,它既保证了所有士兵都驻扎在自己的阵地当中(数据中没有分类错误),又划定出足够宽阔的非交战区,杜绝了偷袭的可能性(数据与决策边界的距离足够大)。

2026-05-12 20:50:45 39

原创 机器学习40讲-16:建模非正态分布广义线性模型

线性”的含义正体现在联系函数的反函数$g(\cdot) {-1}$的输入,也就是自然参数$\boldsymbol\eta$是数据的线性组合,写成数学表达式就是$$ \mu = g ^ {-1}(\boldsymbol\eta) = g ^ {-1} ({\bfX}{\boldsymbol\beta}) $$这说明数据的线性组合${\bfX}{\boldsymbol\beta}$就是联系函数在输入为条件期望$\mu$时的输出。使用指数分布族后,因变量的均值就能够决定误差的性质,从而包含了更多的信息。

2026-05-12 20:05:06 428

原创 机器学习40讲-15:从回归到分类联系函数与降维

对数几率函数的自变量$a$可以改写成$$ a = \ln \dfrac{p({\bf x} | C_1) p(C_1)}{p({\bf x} | C_2) p(C_2)} = \ln \dfrac{p({\bf x} | C_1)}{p({\bf x} | C_2)} + \ln \dfrac{p(C_1)}{p(C_2)} = {\bfw}^T {\bf x} + b $$逻辑回归并不能直接给出参数$\bfw$的解析解,因此需要结合最优化的方法使用。第二,每个类别的数据必须具有相同或者相近的协方差矩阵;

2026-05-12 18:19:41 709

原创 机器学习40讲-14:非线性降维流形学习

北京和纽约两点在三维空间中的欧氏距离对应的是三维空间中的直线,而这条直线位于地球仪的内部——按照这种理解距离的方式,从北京去纽约应该坐一趟穿越地心的直达地铁。在机器学习中,流形流(manifold)指的是嵌入在高维数据空间中的低维子空间,它的维数是低维数据变化的自由度(degree of freedom of variability),也叫作固有维度(intrinsic dimensionality)。这两种改进的目的是一样的,那就是让相同结构的数据点在低维空间上更加致密,不同结构的数据点则更加疏远。

2026-05-11 21:53:33 275

原创 机器学习40讲-13:线性降维主成分的使用

将$\bfX$的奇异值分解代入岭回归的预测输出中,就可以得到:$$ {\bfX} {\hat \beta} = \sum\limits_{j = 1}^p {\bf u}_j \dfrac{d^2_j}{d^2_j + \lambda}{\bf u}^T_j {\bf y}$$其中的${\bf u}_j$是矩阵$\bfU$的列向量,也是$\bfX$的列空间的一组正交基,而岭回归计算出的结果正是将训练数据的输出$\bfy$投影到以${\bf u}_j$为正交基的子空间上所得到的坐标。

2026-05-11 12:10:22 530

原创 机器学习40讲-12:正则化处理收缩方法与边际化

那么利用训练数据$\bf y$估计测试数据$y^*$时,输出的预计分布(predictive distribution)就可以写成以下的条件概率$$p(y^* | {\bf y}, \alpha, \sigma ^ 2)$$$$= \int p(y^* | {\bfw}, \sigma ^ 2) p({\bfw} | {\bf y}, \alpha, \sigma ^ 2) {\rmd}{\bfw}$$在这个式子中,$\alpha$和$\sigma ^ 2$都是独立于训练数据的超参数。

2026-05-11 10:25:42 369

原创 机器学习40讲-11:基础线性回归一元与多元

根据几何知识不难得出,要找的最佳近似$\hat {\bf y}$就是${\bf y}$在超平面上的投影,而最佳近似所对应的系数$\hat {\boldsymbol\beta}$就是线性回归的解,点$\hat {\bf y} = {\bfX}{\boldsymbol \beta}$和${\bf y}$之间的距离就是估计误差,也叫残差(residual),它就是最小二乘法最小化的对象,其表达式是$|| {\bf y} - {\bfX}{\boldsymbol\beta}|| ^ 2$。

2026-05-10 17:31:49 282

原创 MySQL-select ... for update语句详解

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程。

2026-05-10 15:34:52 231

原创 MySQL-BinLog是如何做到数据同步的

BinLog 数据同步 =主库记录变更日志(ROW 格式最佳)→ 从库拉取并按顺序回放 → 通过 GTID 或位点定位进度,从而实现最终一致的副本。t=Q239人工智能教程​​​​https://www.captainai.net/troubleshooter。

2026-05-10 15:21:10 387

原创 机器学习40讲-10:特征预处理

显然,空间标识算法将所有的数据点都映射到高维空间的球面上,这个映射和标准化或者归一化的不同之处在于它处理的对象并不是所有样本的同一个特征,而是同一个样本的所有特征,让所有样本呈现一致的尺度。二是出现频率最高的特征取值的出现频率应该在出现频率次高的特征取值频率的20倍以上,如果有90个样本的特征取值为1,4个样本的特征取值为2,其余取值的样本数目都在4个以下,这样的特征就可以被删除了。可如果把(身高,体重)的二元组看作二维空间上的点的话,代表我自己的点显然和代表S码的点之间的欧式距离更近。

2026-05-08 21:40:37 258

原创 数组第K大数字求解:单核/多核算法设计-Java

算法时间复杂度空间复杂度适用场景快速选择O(n)最优O(1)大数据量、追求极致性能小根堆O(nlogk)O(k)数据量中等、代码简洁单核首选:快速选择算法O(n)最优,小根堆O(nlogk)简洁易用多核首选分治并行+快速选择,自动适配CPU核心数,大数据量下效率最大化Java实现要点:线程池管理线程、子数组TopK剪枝、最终快速选择归并结果边界处理:数组长度≤核心数时自动降级为单核算法,避免冗余开销t=Q239。

2026-05-08 16:15:23 567

原创 机器学习40讲-09:实验设计

这个假设在实际的学习任务中显然并不总是成立的,埃塞姆·阿帕丁(Ethem Alpaydin)在他的《机器学习导论》(Introduction to Machine Learning, 3rd Edition)中提到,在主成分分析的预处理与$K$近邻分类的级联算法中,主成分数目的每个选择都给后面的$K$近邻定义出一个全新的输入空间,这会使$K$近邻的最优超参数出现变化——在10维输入中计算出的最优近邻数目未必适用于15维的输入。机器学习的目标是模拟数据的内在生成机制,取得较低的泛化误差和较强的预测精度。

2026-05-06 23:25:05 291

原创 机器学习40讲-08:模型的评估指标

分享一个大牛的人工智能教程。零基础!通俗易懂!风趣幽默!希望你也加入到人工智能的队伍中来!请轻击人工智能教程​https://www.captainai.net/troubleshooter用训练数据集拟合出备选模型的参数,再用验证数据集选出最优模型后,接下来就到了是骡子是马牵出来溜溜,也就是模型评估的阶段了。模型评估中使用的是测试数据集,通过衡量模型在从未出现过的数据上的性能来估计模型的泛化特性。为简便起见,我将以二分类任务为例来说明度量模型性能的不同指标。二分类任务是最重要也最基础的机器学习任务,其最直

2026-05-06 21:37:03 365

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除