机器学习
文章平均质量分 79
想变厉害的大白菜
这个作者很懒,什么都没留下…
展开
-
【机器学习】Radius Neighbors Classifier(rNN,radius nearest neighbors)
本文介绍了机器学习算法:Radius Neighbors Classifier(rNN),半径近邻分类器原创 2022-12-26 17:32:52 · 2619 阅读 · 2 评论 -
【机器学习】KNN 算法介绍
本文介绍了机器学习模型:KNN 算法原创 2022-12-26 11:06:27 · 9705 阅读 · 0 评论 -
【Pytorch】torch.max() 函数详解
本文介绍了【Pytorch】中的 torch.max() 函数原创 2022-12-07 17:53:33 · 10640 阅读 · 0 评论 -
【Pytorch】unsqueeze() 方法
本文简单介绍了【Pytorch】中的 unsqueeze() 方法原创 2022-12-07 17:10:58 · 6261 阅读 · 0 评论 -
【Pytorch】.item() 方法介绍
本文介绍了【Pytorch】中的 .item() 方法原创 2022-12-07 16:46:47 · 5966 阅读 · 0 评论 -
【Pytorch】torch.argmax 函数详解
本文介绍了 Pytorch 中的 torch.argmax 函数原创 2022-12-07 12:38:26 · 7655 阅读 · 1 评论 -
CIFAR-10 数据集简介
CIFAR-10 数据集简介原创 2022-11-30 18:19:22 · 16209 阅读 · 0 评论 -
【KNN分类】kd-tree
本文介绍了能够改进【KNN分类】算法效率的数据结构:kd-tree原创 2022-08-23 16:26:02 · 1331 阅读 · 0 评论 -
【机器学习】PCA - 主成分分析
本文简单介绍了PCA的思想原创 2022-07-13 17:15:23 · 388 阅读 · 0 评论 -
【机器学习】自动编码器 - Autoencoder
本文简单介绍了自编码器的原理原创 2022-07-12 17:00:43 · 15086 阅读 · 1 评论 -
【机器学习】在线学习 - Online Learning
本文简单介绍了在线学习原创 2022-07-11 16:33:54 · 5857 阅读 · 0 评论 -
【机器学习】随机森林 – Random forest
本文介绍了随机森林的基础知识原创 2022-07-11 15:56:14 · 8048 阅读 · 1 评论 -
【机器学习】集成学习 - Ensemble Learning
本文介绍了集成学习的概念及原理原创 2022-07-11 11:21:58 · 620 阅读 · 0 评论 -
【机器学习】决策树 – Decision Tree
本文介绍了决策树的基本知识原创 2022-07-11 09:56:27 · 978 阅读 · 0 评论 -
【机器学习 - 决策树】信息增益
本文解释了决策树模型中用到的信息增益的概念原创 2022-07-11 08:48:26 · 2142 阅读 · 0 评论 -
【Pytorch】模型的保存与恢复、pth 文件
文章目录一、pth 文件中保存的是什么二、使用 torch.save()/torch.load() 保存/恢复模型1. torch.save() 保存模型2. torch.load() 恢复模型参考链接一、pth 文件中保存的是什么import torchstate_dict = torch.load("resnet18.pth")print(type(state_dict))---------------<class 'collections.OrderedDict'>如上原创 2022-04-05 14:57:59 · 4230 阅读 · 0 评论 -
【Pytorch】交叉熵损失函数 CrossEntropyLoss() 详解
文章目录一、损失函数 nn.CrossEntropyLoss()二、什么是交叉熵三、Pytorch 中的 CrossEntropyLoss() 函数参考链接一、损失函数 nn.CrossEntropyLoss()交叉熵损失函数 nn.CrossEntropyLoss() ,结合了 nn.LogSoftmax() 和 nn.NLLLoss() 两个函数。它在做分类(具体几类)训练的时候是非常有用的。二、什么是交叉熵交叉熵主要是用来判定 实际的输出与期望的输出的接近程度。举个例子:在做分类训练的原创 2022-04-01 20:32:05 · 33759 阅读 · 9 评论 -
【Pytorch】简单神经网络搭建:通过继承 Module 类自定义模型
文章目录一、如何使用 Pytorch 自定义模型?1. 自定义模型的方法:继承 Module 类2. Module 类原型:二、Pytorch 构建神经网络模型1. 如何通过继承 Module 实现自己的网络?2. 如何重写 __init__ 和 forward ?3. 自定义网络的技巧4. 实例(1)将不具有可学习参数的层放在构造函数__init__中:(2)将不具有可学习参数的层放在 forward 中:三、进阶:通过Sequential来包装层方式一:最基础,包装块内部的层没有 name方式二:用原创 2022-03-31 19:30:46 · 4910 阅读 · 0 评论 -
【深度学习 - 图像基础】通过图像格式 RGB 理解通道
文章目录一、图片是怎么存储的?二、RGB 色彩空间参考链接一、图片是怎么存储的?图片可以看作是 三层 二维数组 的叠加,每一层二维数组都是一个通道。单通道的图像是灰色的,每个像素pixel只有一个value,数字越高,颜色越白,也就越亮。在一个定义好的色彩空间里,这三层的 value 分别代表着这个点在三个通道的数值,计算机根据这些数值来确定这一个像素点的颜色。每个不同的色彩空间都有着自己的调色盘,不同的色彩空间对于数值有着不同的规定。根据调色盘,像素在屏幕上的显示出自己的颜色。如下图中,橙色的原创 2022-03-31 16:30:12 · 9237 阅读 · 1 评论 -
【Pytorch】torch.max() 函数介绍与使用
文章目录一、torch.max(input, dim) 函数二、实例参考链接一、torch.max(input, dim) 函数output = torch.max(input, dim)输入:input 是一个tensordim 是 max 函数索引的维度,dim 为 0 时返回每列最大值,dim 为 1 时返回每行最大值输出:函数会返回两个tensor,第一个 tensor 是某维度(dim)上的最大值;第二个 tensor 是最大值的索引(位置)。二、实例import torc原创 2022-03-28 15:55:17 · 2247 阅读 · 0 评论 -
【Pytorch】model.train() 和 model.eval() 原理与用法
文章目录一、两种模式二、功能1. model.train()2. model.eval()为什么测试时要用 model.eval() ?3. 总结与对比三、Dropout 简介参考链接一、两种模式pytorch可以给我们提供两种方式来切换训练和评估(推断)的模式,分别是:model.train() 和 model.eval()。一般用法是:在训练开始之前写上 model.trian() ,在测试时写上 model.eval() 。二、功能1. model.train()在使用 pytorch原创 2022-03-27 22:14:37 · 43397 阅读 · 7 评论 -
【PyTorch】torch.manual_seed() 详解
本文详细介绍了 torch.manual_seed(seed) 及其用法原创 2022-03-27 10:49:09 · 40461 阅读 · 7 评论 -
【PyTorch】torch.utils.data.Dataset 介绍与实战
本文介绍了 torch.utils.data.Dataset原创 2022-03-25 21:01:59 · 18579 阅读 · 6 评论 -
【PyTorch】torch.utils.data.DataLoader 简单介绍与使用
文章目录一、torch.utils.data.DataLoader 简介二、实例参考链接一、torch.utils.data.DataLoader 简介作用:torch.utils.data.DataLoader 主要是对数据进行 batch 的划分。数据加载器,结合了数据集和取样器,并且可以提供多个线程处理数据集。在训练模型时使用到此函数,用来 把训练数据分成多个小组 ,此函数 每次抛出一组数据 。直至把所有的数据都抛出。就是做一个数据的初始化。好处:使用DataLoader的好处是原创 2022-03-25 19:53:25 · 52900 阅读 · 6 评论 -
【联邦学习】FedAvg 过程简介
文章目录一、FedAvg 简介二、联邦训练过程参考链接一、FedAvg 简介FedAvg是一种分布式框架,允许多个用户同时训练一个机器学习模型。在训练过程中并不需要上传任何私有的数据到服务器。本地用户负责训练本地数据得到本地模型,中心服务器负责 加权聚合本地模型 从而得到全局模型,经过多轮迭代后最终得到一个趋近于集中式机器学习结果的模型,有效地降低了传统机器学习源数据聚合带来的许多隐私风险。二、联邦训练过程首先用户从服务器中下载模型参数,更新本地模型参数,进行本地机器学习训练。其次在用原创 2022-03-25 16:12:52 · 11625 阅读 · 2 评论 -
【机器学习】感知机、线性支持向量机
本文介绍了感知机及其实战,以及改进感知机的线性支持向量机原创 2022-03-17 17:06:29 · 1258 阅读 · 0 评论 -
【联邦学习】横向联邦学习(Horizontal Federated Learning,HFL)
文章目录一、横向联邦学习的定义二、横向联邦学习的安全性三、横向联邦学习架构1. 客户-服务器架构2. 对等网络架构四、联邦优化五、联邦平均算法参考链接一、横向联邦学习的定义横向联邦学习也称为按样本划分的联邦学习(Sample-Partitioned Federated Learning 或 Example-Partitioned Federated Learning),可以应用于联邦学习的各个参与方的数据集有相同的特征空间和不同的样本空间的场景,类似于在表格视图中对数据进行水平划分的情况。事实上,横向原创 2022-03-12 20:53:27 · 12344 阅读 · 0 评论 -
【联邦学习】联邦学习的应用领域、开源平台
文章目录一、联邦学习的应用二、联邦学习的开源平台参考链接一、联邦学习的应用联邦学习已经被应用于 计算机视觉 领域,例如医学图像分析。联邦学习也被应用于 自然语言处理 和 推荐系统 领域。谷歌的研究人员将联邦学习应用于 手机键盘的输入预测,即谷歌的Gboard系统。这种方法大大提升了智能手机输入法预测的准确度,且不会泄露用户的隐私数据。Firefox的研究人员在 预测搜索词 上使用了联邦学习。二、联邦学习的开源平台人工智能的研究者对于联邦学习的兴趣并不局限于理论工作,关于联邦学习算法和系原创 2022-03-12 20:07:44 · 5237 阅读 · 0 评论 -
【联邦学习】IID与非IID数据
文章目录一、引言二、什么是IID、非IID三、联邦学习下的IID与非IID参考链接一、引言在联邦学习系统中,来自不同参与方的数据可能会导致出现 非独立同分布 的情况。并且不同的参与方可能有数量不均的训练数据样本,这可能导致联邦模型产生偏差,甚至会使联邦模型训练失败。在联邦学习系统中,因为数据是由用户自己收集的,可能各自相差很大。但是如果数据非独立同分布就会影响训练。所以联邦学习中存在数据是IID还是非IID的讨论。二、什么是IID、非IID数据独立同分布(Independent Identic原创 2022-03-12 10:20:12 · 4887 阅读 · 1 评论 -
【机器学习】显卡、GPU、NVIDIA、CUDA、cuDNN
文章目录一、显卡和GPU1. 显卡是什么?2. GPU是什么?(1)GPU和显卡的关系(2)GPU的由来与发展二、CUDA1. CUDA是什么?2. 为什么推出CUDA?三、cuDNN1. 什么是cuDNN2. CUDA与cuDNN的关系四、NVIDIA参考链接一、显卡和GPU1. 显卡是什么?显卡是显示卡的简称,显卡是由GPU、显存等等组成的。显卡(Video card,Graphics card)全称显示接口卡,又称显示适配器,是计算机最基本配置、最重要的配件之一。就像电脑联网需要网卡,主.原创 2022-01-05 15:23:53 · 10418 阅读 · 2 评论 -
【机器学习】集成学习
文章目录一、什么是集成学习(ensemble learning)二、bagging三、Boosting四、Bagging 和 Boosting 的 4 点差别参考链接一、什么是集成学习(ensemble learning)什么是集成学习?一句话,三个臭皮匠顶个诸葛亮,一箭易折十箭难折,千里之堤溃于蚁穴。在分类的表现上就是,多个弱分类器组合变成强分类器。一句话,假设各弱分类器间具有一定差异性(如不同的算法,或相同算法不同参数配置),这会导致生成的分类决策边界不同,也就是说它们在决策时会犯不同的错原创 2021-12-19 21:02:42 · 149 阅读 · 0 评论 -
【机器学习】验证集和测试集有什么区别
文章目录定义验证集和测试集的区别参考链接:定义Ripley 的著作《模式识别与神经网络》(Pattern Recognition and Neural Networks)中,训练集、验证集和测试集的定义如下:训练集:用来学习的样本集,用于分类器参数的拟合。验证集:用来调整分类器超参数的样本集,如在神经网络中选择隐藏层神经元的数量。测试集:仅用于对已经训练好的分类器进行性能评估的样本集。验证集和测试集的区别验证集和测试集的对比验证集的作用:使用验证集是为了快速调参,也就是用验证原创 2021-10-17 19:40:15 · 30173 阅读 · 0 评论 -
【机器学习】独立同分布(IID)数据集
文章目录独立同分布(I.I.D.)是什么?参考链接:独立同分布(I.I.D.)是什么?机器学习领域有个很重要的假设:IID独立同分布假设,就是假设训练数据和测试数据是满足相同分布的,这是通过训练数据获得的模型能够在测试集获得好的效果的一个基本保障。也就是说,在训练数据和测试数据是独立同分布的情况下,在训练集上训练得到的模型能很好地在测试集上泛化,取得良好的性能。参考链接:https://www.cnblogs.com/jiangkejie/p/9986417.html...原创 2021-10-17 11:13:00 · 5417 阅读 · 0 评论 -
【机器学习】PAC 学习理论
本文简单介绍了 PAC 学习理论原创 2021-10-17 10:34:45 · 6599 阅读 · 0 评论 -
【机器学习】特征选择方法—Filter,Wrapper,Embedded
【机器学习】特征选择方法什么是特征选择?为什么需要特征选择?特征选择的两个关键环节常见的特征选择方法参考链接:什么是特征选择?Feature Selection 是在模型构建过程中选择最相关、最有利于提高预测效果的特征子集的过程,也是数据预处理的重要步骤之一。和降维的区别:机器学习中的特征选择(Feature Selection)也被称为 Variable Selection 或 Attribute Selection。虽然特征选择和降维(dimensionality reduction)都是为原创 2021-10-16 21:46:40 · 3679 阅读 · 1 评论 -
【机器学习】深度学习的三个概念:Epoch, Batch, Iteration
文章目录含义解释参考链接含义解释Epoch(时期):当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一次>epoch。(也就是说,所有训练样本在神经网络中都进行了一次正向传播 和一次反向传播 )再通俗一点,一个Epoch就是将所有训练样本训练一次的过程。然而,当一个Epoch的样本(也就是所有的训练样本)数量可能太过庞大(对于计算机而言),就需要把它分成多个小块,也就是就是分成多个Batch 来进行训练。Batch(批 / 一批样本):将整个训练样本分成若干个Batc原创 2021-10-15 16:38:53 · 4894 阅读 · 0 评论 -
【机器学习】“冷启动” 问题
【机器学习】“冷启动”问题1. 什么是“冷启动”问题?2. “冷启动”问题的分类3、如何解决冷启动问题?参考链接:1. 什么是“冷启动”问题?在缺乏有价值数据的时候,如何有效地满足业务需求的问题,就是“冷启动问题”。冷启动在推荐系统中表示该系统积累数据量过少,无法给新用户做个性化推荐的问题,这是产品推荐的一大难题。冷启动问题是机器学习系统中十分常见、无法回避的问题,因为任何机器学习系统都要经历从无到有的过程。试想,你作为一个新用户,在没有用户数据的情况下,淘宝如何给你个性化推荐商品,抖音如何给你个原创 2021-10-15 16:14:27 · 9280 阅读 · 0 评论 -
【机器学习】深度学习框架是什么?有哪些?如何选择?
文章目录深度学习框架是什么深度学习框架有哪些如何选择合适的框架1. TensorFlow2. PyTorch3. Caffe 1.04. Theano5. MXNet6. Keras7. Chainer参考链接深度学习框架是什么深度学习框架像Caffe、tensorflow,这些是深度学习的工具,简单来说就是库,编程时需要import caffe、import tensorflow。作一个简单的比喻,一套深度学习框架就是这个品牌的一套积木,各个组件就是某个模型或算法的一部分,你可以自己设计如何使用积原创 2021-09-15 19:50:00 · 11360 阅读 · 0 评论 -
如何快速找到机器学习领域最新最好的研究成果?
机器学习SOTA模型大集合SOTA模型参考链接SOTA模型SOTA,全称「state-of-the-art」,用于描述机器学习中取得某个任务上当前最优效果的模型。例如在图像分类任务上,某个模型在常用的数据集(如 ImageNet)上取得了当前最优的性能表现,我们就可以说这个模型达到了 SOTA。如果你是一位机器学习研究者,需要持续了解最前沿研究进展;或者你希望将最前沿的机器学习研究应用于自己从事的领域。你最需要的是从论文海洋中找到SOTA 论文。「SOTA模型」是机器之心的一个产品,致力于将机器原创 2021-09-08 20:14:51 · 1782 阅读 · 0 评论 -
安装mingw+Theano+keras(多警告、错误解决办法)
Anaconda、python3.8环境下安装Theano可以安装theano的python版本创建虚拟环境+安装theano参考链接可以安装theano的python版本theano兼容的python版本: - theano -> python[version='>=2.7,<2.8.0a0|>=3.7,<3.8.0a0|>=3.8,<3.9.0a0|>=3.6,<3.7.0a0|>=3.5,<3.6.0a0']创建虚拟环境+安原创 2021-09-03 19:52:13 · 1727 阅读 · 0 评论