超级虚空-CSDN博客

原创 7-贝叶斯分类器

EM算法的核心思想是通过迭代的方式，通过观测数据和隐变量的期望值来更新参数的估计值。M步骤（Maximization Step）：在M步骤中，使用E步骤中计算得到的隐变量的期望值，通过最大化完全数据的对数似然函数或对数后验概率函数来更新参数的估计值。E步骤（Expectation Step）：在E步骤中，计算隐变量的后验概率（给定观测数据和当前参数估计），并将其作为隐变量的期望值。是在半朴素贝叶斯的基础上更加泛化的模型，具有更强大和灵活的建模能力，可以更准确地表示和推断变量之间的复杂关系。

2024-02-01 21:27:23 945

原创 3-线性模型部分题解

ECOC 编码能起到理想纠错作用的重要条件是:在每一位编码上出错的概率相当且独立.试析多分类任务经 ECOC 编码后产生的二类分类器满足该条件的可能性及由此产生的影响.对实数集上的函数，可通过求二阶导数来在判别，若二阶导数在区间中非负，则称为凸函数，若二阶导数在区间上恒大于 0，则称为严格凸函数.(p54)试推导出多分类代价敏感学习(仅考虑基于类别的误分类代价)使用"再缩放"能获得理论最优解的条件.，对率回归的目标函数非凸，但对数似然函数是凸的。编程实现对率回归，并给出西瓜数据集。，只能用拟牛顿法了😿。

2024-01-19 22:57:02 376

原创最小二乘法-多个角度解释

最小二乘法在机器学习中的应用及其数学推导。从损失函数到最优权重的推导，强调了伪逆和奇异值分解在非满秩样本集中的应用。通过向量空间解释最小二乘法的总误差最小化思想，同时从概率视角考虑噪声服从高斯分布。最后，讨论了权重先验为高斯分布的最大后验估计。最小二乘法及其不同视角的应用和解释。

2024-01-17 13:12:02 825

原创【西瓜书】1-绪论习题

若数据包含噪声,则假设空间中有可能不存在与所有训练样本都一致的假设。也就是说要求最多使用k个，可以先只使用k-1个，然后将k-1个的结果再加上单个范式组合起来，复杂度不超过。表1. 1 西瓜分类问题的假设空间，试估算共有多少种可能的假设.与使用单个合取式来进行假设表示相比,使用"析合范式"将使得假设空间具有更强的表示能力。表1. 1 中若只包含编号为 1 和 4 的两个样例?这里笔者也给出自己写的题解，和部分网上答案不一致，不保证准确性。前面忘了，中间忘了，总之成立。表1.1的训练数据集对应的。

2024-01-15 16:08:20 1086

原创 kde安装deepin微信报错 X Error of failed request: BadWindow (invalid Window parameter)解决方案

原因是没有安装 gsd-settings，需要安装并启动相关服务。

2023-07-22 19:06:23 1017

原创 wsl 网络配置, 代理配置, 常用软件代理

wsl设置网络代理, 自动配置代理, git curl 使用代理

2023-03-31 01:34:43 3905

原创 HyperLogLog 算法

如果您对此数据结构还是不理解，可以尝试阅读斯坦福的PPT。

2023-03-16 22:54:49 129

原创 Unity 报错 “isReadable is false； Read/Write must be enabled in import settings“

在使用PolyBrush时报错，虽然对游戏没有影响但是报错还是很烦人的。上网浏览发现是模型导入设置的问题，因为模型不可读写，估计是PolyBrush无法获取模型信息，导致的报错。Read/Write。

2023-03-11 12:43:58 1231

原创【西瓜书】5-神经网络

逻辑运算是线性可分问题，如果俩类是线性可分的，那么存在一个线性超平面将他们分开，感知机可以通过修改权重和阈值学习到（这里我当成线性模型中的学习）。上图是一个能解决异或问题的二层感知机，这个感知机通过中间层的计算，对样本进行了升维操作，于是原本在二维下线性不可分的问题在三维空间下线性可分了。多层网络的学习能力比单层网络强得多，但是可能的权重和阈值的组合数也变多了，这时候需要更加强大的学习算法。局部最小并不一定是全局最小，可能我们的算法在梯度下降时陷在局部最小出不去，得到的结果就不是最优的。

2022-11-27 18:15:30 469

原创【西瓜书】4-决策树

C4.5决策树解决ID3决策树的一个缺点，剪枝处理是避免模型过拟合的常用手段，常见的有预剪枝和后剪枝。

2022-11-24 14:07:18 2252

原创【李宏毅机器学习】task06-卷积神经网络

经过卷积层和池化层降维过的数据，全连接层才能”跑得动”，不然数据量太大，计算成本高，效率低下，还会出现过拟合。具体的，如下图，我们定义一些卷积核函数，这些函数能表示图像中的特征，且可以通过组合卷积核来拼凑出完整的图像。这个部分就是最后一步了，经过卷积层和池化层处理过的数据输入到全连接层，得到最终想要的结果。并且也解释了，先对g函数进行翻转，相当于在数轴上把g函数从右边褶到左边去，也就是卷积的“然后再把g函数平移到n，在这个位置对两个函数的对应点相乘，然后相加，这个过程是卷积的“在概率论中，卷积表示成这样。

2022-11-24 00:31:47 121

原创【李宏毅机器学习】task05-网络设计的技巧

在训练过程中，不可避免的会有局部最小值和鞍点的问题。它们的梯度都为0，我们把这两种点统称为临界点（Critical Point）当然为了防止陷入局部最小值，我们可以在学习率十分低时突然清零，跳出局部，看看最后收敛是否还在原来位置。如下图，下一步有梯度和学习率共同决定，随迭代次数逐渐增加，梯度会越来越小。我们需要梯度朝向损失函数小的地方，所以使用负特征值对应特征向量。：即使有一个段是局部最小值，其他部分不是，那么就不是局部最小值。，使梯度由当前梯度和历史梯度共同决定。为正定矩阵（所有特征值为正）时，

2022-11-24 00:31:00 261

原创【西瓜书】3-线性模型

假设正例有999个，但是反例只有一个，那么只需要将所有的例子都输出为正例行。但是我们其实更加看重那一个反例，而非另外的999个正例。意思就是将数据投影在低维度上，并且投影后同种类别数据的投影点尽可能的接近，不同类别数据的投影点的中心点尽可能的远。其含义是越靠近中心点的概率越高，越远离中心点的概率越低，但是函数预测的确定性越高。(2.2) 是回归任务中最常用的性能度量，因此我们可试图让均方误差。对于多个分类的问题，可以将多分类问题转化为多个二分类问题。越大，那么预测为蓝色的概率越高，反之越低。

2022-11-23 22:12:07 421

原创【计算机网络】3-传输层

什么是可靠：不错、不丢、不乱可靠数据传输对各层都很重要网络Top-10问题信道的不可靠特性决定了可靠数据传输协议的复杂性服务角度实现角度接口rdt_send：被上层应用调用，将数据交给rdt以发送给对方udt_send：被rdt调用，在不可靠信道上向接收方传输数据(IP协议)rdt_rcv：当数据包接收时调用deliver_data：被rdt调用，向上层应用交付数据程序就是状态机特点点对点，沿途路由器不会影响连接状态可靠的、按序的字节流流水线机制。

2022-09-30 20:03:07 915

原创【计算机网络】1-计算机网络概述

计算机网络 = 通信系统 + 计算机技术计算机网络是通信技术与计算机技术紧密结合的产物通信系统模型：计算机网络就是一种通信网络计算机网络就是一个互连的、自治的计算机的集合。自治：计算机之间没有主从关系**互连：**互联互通在主机太多时，我们引入交换网络互连主机，其中交换节点称为路由器或交换机计算机角度：全球最大的互联网络Internet通过ISP（Internet Service Provider）网络互连成为网络之网络百万互连的设备的集合。

2022-09-25 15:39:28 594

原创【数据清理与特征工程】2-数据清理

注意下面的代码，我们未定义数据类型时默认为object，现在来改变数据类型，使用astype函数，现在我们成功将数据类型设置为int了。发现不能将 string 转化为 float我们可以忽略错误并转换，得到 object，或者使用to_numeric函数，强制转换。使用duplicated判断是不是重复的数据。在进行数据挖掘的过程中，理解和清洗数据是最耗费时间的事情。你应该知道数据是如何产生的，哪些特征对业务有影响，只有这样你才能给出最好的数据结果。......

2022-07-27 19:06:05 1623

原创【数据准备和特征工程】1-4API中的数据

好了，响应成功，我们看看github给我们响应了什么。注意响应格式一般为json格式，需要使用json方式解析。使用pandas库分析一下吧。

2022-07-26 22:35:29 68

原创【数据准备和特征工程】1-2感知数据库中的数据

【数据准备和特征工程】1-2感知数据库中的数据。

2022-07-26 18:43:38 471

原创【数据准备和特征工程】1-1感知文件中的数据

百度aistudio的课程，名字为数据处理与特征工程。本本节为从文件中读取数据。这是因为opencv的接口使用BGR，而matplotlib.pyplot则是RGB模式。，下面演示从图床中读取文件并展示。注意到图片并不是我们想要的效果。的参数可以是文件路径。...

2022-07-26 18:24:32 529

原创【深入浅出PyTorch】6-进阶训练技巧

以函数形式定义损失函数defloss_func(output,target)#均方误差loss=torch.mean((output-target)**2)returnloss虽然以函数定义的方式很简单，但是以类方式定义更加常用，在以类方式定义损失函数时，我们如果看每一个损失函数的继承关系我们就可以发现Loss函数部分继承自_loss,部分继承自,而继承自_loss，_loss继承自nn.Module。nn.Module类，在下面的例子中我们以DiceLossD。...

2022-07-20 19:16:44 1414

原创【深入浅出PyTorch】5-模型定义

直接顺序Directlist#直接顺序importtorch.nnasnn有序字典OrderedDict#有序字典，可以实现模型名称importcollectionsimporttorch.nnasnn实际上两种方式并没有质的区别。

2022-07-17 14:12:44 269

原创【深入浅出PyTorch】4-基础实战-FashionMINIST

通过Dataset类读取数据。这里我们使用Adam优化器。加载数据以供模型输入。

2022-07-17 13:47:55 448

原创【深入浅出PyTorch】2-pytorch基础知识

从数值到向量，再到矩阵，量的维度不断升高，那么超过3维的我们都可以称作张量，不过更一般的，任何维度都可以用张量表示，如数值就是0维，向量1维，矩阵2未，而上图中的张量就是一个三维的张量。见 2.1.2-创建tensor.ipynbPyTorch是如何实现模型训练的：多元函数求导的雅各比矩阵......

2022-07-11 15:45:58 400

原创李宏毅机器学习-

李宏毅机器学习-1-机器学习介绍

2022-06-13 20:35:07 3297 1

m0_49376775的博客