![](https://img-blog.csdnimg.cn/873b9cbe13314e1f8458c94a7e00256e.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习
文章平均质量分 95
Machine Learning:为童鞋们提供最细致的讲解和最经典的案例。
theSerein
路漫漫其修远兮,吾将上下而求索。
展开
-
【机器学习】深度学习
深度学习本身是一个非常庞大的方向, 其下属的研究内容十分广泛,且颇具研究价值。而本文的内容,是一篇导论性质的文章,仅供初入机器学习和深度学习的学者们参考。随着人工智能的兴起和计算机算力的不断提升,深度学习从机器学习的众多方向中脱颖而出,并不断迸发出强烈生机。基于此,近年来有关深度学习的研究在不断更新,不断前进,有关它的相关领域也早已形成了自己特有的一些研究范畴。原创 2023-12-27 15:06:43 · 812 阅读 · 0 评论 -
【机器学习】支持向量机(实战)
高斯核的本质是(假设原数据集的样本点个数为 n )计算样本点 i 与其他所有样本点的相似度,从而得到一个长度为 n-1 的向量,并以该向量作为该样本点的新特征(此时的特征向量即为 [x_1,…,x_{i-1},x_{i+1}…,x_n])。因此,在用高斯核函数对数据进行处理后,数据的特征将发生本质改变。而新特征的长度则仅与数据集中的样本点个数相关。总结:高斯核是通过计算相似度来进行特征替换的。原创 2023-10-24 10:00:00 · 333 阅读 · 0 评论 -
【机器学习】支持向量机(下)
支持向量机作为传统机器学习算法中的霸主,其背后的数学知识是相当复杂且精密的。对于每个学习机器学习的同学而言,理解并掌握支持向量机的思路对于认识和学习其他算法也会起到非常巨大的推动作用。原创 2023-07-04 21:16:15 · 1051 阅读 · 0 评论 -
【机器学习】支持向量机(上)
支持向量机(Support Vector Machine, SVM)是一类按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。支持向量机作为传统机器学习算法中的霸主,其背后的数学知识是相当复杂且精密的。原创 2023-07-04 18:54:14 · 1369 阅读 · 0 评论 -
【机器学习】集成学习(实战)
集成学习(Ensemble Learning),通过构建并结合多个学习器来完成学习任务。一般结构是:先产生一组“个体学习器”,再用某种策略将它们结合起来。结合策略主要有平均法、投票法和学习法等。因此,有时也称集成学习为多学习器系统(multiclassifier system)、基于委员会的学习。Bagging 模型首先对训练数据集进行多次采样,保证每次得到的采样数据都是不同的。接下来会分别训练多个同质模型,例如树模型。在预测时需得到所有模型的预测结果再进行集成。原创 2023-06-05 00:11:56 · 772 阅读 · 0 评论 -
【机器学习】集成学习(理论)
集成学习(Ensemble Learning),通过构建并结合多个学习器来完成学习任务。一般结构是:先产生一组“个体学习器”,再用某种策略将它们结合起来。结合策略主要有平均法、投票法和学习法等。因此,有时也称集成学习为多学习器系统(multiclassifier system)、基于委员会的学习(committee-based learning)。原创 2023-05-08 21:24:49 · 3793 阅读 · 6 评论 -
【机器学习】决策树(实战)
决策树不仅在理论上很容易理解(机器学习“最友好”的算法),实现时还能对构建过程进行可视化(诸如神经网络等算法本身就是黑盒模型,更难可视化展示模型的构建)。因此,决策树的另一大优势就是能利用相关包来查看构建的树模型。下面介绍一个可以对决策树进行可视化展示的包。原创 2023-04-11 19:36:08 · 5142 阅读 · 6 评论 -
【机器学习】决策树(理论)
决策树(Decision Tree)是一种分类和回归方法,是基于各种情况发生的所需条件构成决策树,以实现期望最大化的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。它的运行机制非常通俗易懂,因此被誉为机器学习中,最“友好”的算法。决策树由结点和有向边组成。结点有两种类型:内部结点(圆)和叶结点(矩形)。其中,内部结点表示一个特征(属性);叶结点表示一个类别。而有向边则对应其所属内部结点的可选项(属性的取值范围)。原创 2023-03-02 22:03:32 · 19426 阅读 · 20 评论 -
【机器学习】聚类算法(实战)
聚类(Clustering),是指在一大推数据中采用某种方式或准则来将一些具有相同或相似性质和特征的数据划分为一类。聚类是无监督学习的典型算法,相较于有监督学习,由于聚类针对的大多是无标签数据,因此对于最终构建的模型而言,在进行模型评估时会比较麻烦。同时,在对算法进行调参时也会因为这种不确定性而稍带困难。原创 2023-02-10 22:51:04 · 947 阅读 · 3 评论 -
【机器学习】聚类算法(理论)
聚类分析,即聚类(Clustering),是指在一大推数据中采用某种方式或准则来将一些具有相同或相似性质和特征的数据划分为一类。聚类是无监督学习的典型算法,相较于有监督学习,由于聚类针对的大多是无标签数据,因此对于最终构建的模型而言,在进行模型评估时会比较麻烦。同时,在对算法进行调参时也会因为这种不确定性而稍带困难。原创 2023-02-01 02:17:43 · 1994 阅读 · 4 评论 -
【机器学习】逻辑回归(实战)
决策边界的绘制步骤如下:① 构建坐标数据,合理的范围当中,根据实际训练时输入数据来决定(可参考 iris.DESCR)② 整合坐标点,得到所有测试输入数据坐标点③ 预测,得到所有点的概率值④ 绘制等高线,完成决策边界原创 2023-01-28 23:30:00 · 2013 阅读 · 2 评论 -
【机器学习】逻辑回归(理论)
逻辑回归(Logistic Regression)是一种分类方法,主要用于二分类问题(即输出只有两个结果:是与不是)。因此,其与线性回归的不同之处仅在最终的输出结果上。对于任意输入的特征向量,我们仍然可用线性回归的方式来先算出该向量的预测值,然后再将该预测值作为阶跃函数 sgn(x) 的输入,最终由阶跃函数的输出值作为逻辑回归的最终结果。此时,当测值大于零时就判为正例;小于零则判为反例;预测值为临界值 0 时则任意判别。原创 2023-01-16 23:51:34 · 1984 阅读 · 2 评论 -
【机器学习】线性回归(实战)
首先计算在所有数据上的损失值,然后再进行梯度下降。具体操作步骤是:遍历全部数据集算一次损失函数,然后算函数对各个参数的梯度,并更新梯度。这种方法每更新一次参数,都要把数据集里的所有样本计算一遍,因此得出的梯度往往都是朝着正确的方向;但是其缺陷是计算量过大,导致计算速度慢,因而不支持在线学习。原创 2023-01-12 22:02:38 · 1038 阅读 · 2 评论 -
【机器学习】线性回归(理论)
线性回归的目的,是根据已知的特征信息 X 和对应的函数值 y ,来寻找一个能尽可能拟合真实情况的回归方程(即求出 θ 向量)。在概率论中,若已知一组观测数据和这组数据服从的分布,我们要如何求出该组数据满足的分布的具体数值呢?一个比较直观的方法是:极大似然估法。原创 2023-01-01 23:01:17 · 2487 阅读 · 11 评论 -
【机器学习】模型评估与选择(实战)
为了设计实验来对学习器的泛化误差进行评估,并对各指标进行测试,在此设计二分类实验。由于 Mnist 数据集含有数字 0-9 (具有多类),一种简单直接的设计模式是:选择某个数字(如 5 )作为正例,则其余数字即为反例。因此,这样就构建好了一个二分类实验。原创 2022-12-27 18:58:14 · 1656 阅读 · 2 评论 -
【机器学习】模型评估与选择(理论)
测试集很宝贵,最好是在调参、优化之后,最终再用于测试。就像历年高考真题一样,最好用在最终临考前进行测试,以评估自己大概能取得怎样的成绩。所以对于训练集而言,可以单独划分一些数据出来用于提前“测试”(可以理解为月考),来帮助用于调整、优化自己。因此,可把单独划分出来的这部分数据称为“验证集”。例如,可将训练集中的数据划分为互斥的 k 份(尽量保证数据分布的一致性),将其中的 k-1 份用于训练,剩下的那 1 份用于验证(按这样的划分方式可获得 k 组训练 / 测试集)。原创 2022-12-25 22:01:03 · 1472 阅读 · 6 评论 -
【机器学习】EM算法
EM算法的思路如下:1. 给 𝜃~𝐴~ 、 𝜃~𝐵~ 一个初始值;2. 分别计算每组实验在抛掷硬币A、硬币B的情况下所得概率,并根据该概率值去分别计算两硬币正面朝上次数的期望值。因此,此步骤也被称为“E过程”;3. 分别用第 2 步中计算的每组期望值来计算 𝜃~A~^(𝑖)^、𝜃~B~^(𝑖)^;4. 将计算得到的 𝜃~A~^(𝑖)^、𝜃~B~^(𝑖)^ 回代第 2、3 步,并不断迭代得到 𝜃~A~^(𝑖+1)^、𝜃~B~^(𝑖+1)^ , 直至收敛(或到一定精度)。原创 2022-11-23 23:02:57 · 2058 阅读 · 4 评论 -
【机器学习】Sklearn导入手写数字数据集 Mnist 失败的解决办法
导入手写数字数据集Mnist失败的解决办法:ImportError: cannot import name 'fetch_mldata' from 'sklearn.datasets' (D:\Python\Python3.9\lib\site-packages\sklearn\datasets\__init__.py)原创 2022-11-03 17:05:19 · 2913 阅读 · 2 评论