自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 A2-RIDE Long-tailed recognition by routing diverse distribution-aware experts

自然数据通常是长尾分布在语义类上。现有的识别方法通过将更多的重点放在尾部数据上来解决这种不平衡的分类,通过在不同的数据组上进行类重新平衡/重新加权或组合,从而导致尾部准确度增加但头部准确度降低。我们对训练数据采取动态视图,并在训练数据波动时提供原则性的模型Bias和Variance分析:现有的长尾分类器总是增加模型的Variance和头-尾模型的Bias差距仍然很大,由于更多和更大的混乱与硬否定的尾巴。我们提出了一个新的长尾分类称为路由多样性专家 RIDE。

2023-05-14 23:02:23 850

原创 pip更改源

【代码】pip更改源。

2023-05-12 20:58:25 188

原创 数据库原理+openGauss

openGauss 实验环境部署模式:通过创建虚拟机,选用开源操作系统openEuler来搭建,无额外使用成本。VirtualBox官网下载后,如下图所示:使用putty连接虚拟机,从本地电脑通过配置enp0s3网卡的ip地址(从ifconfig可知,为192.168.56.101)来连接虚拟机。使用用户来登录,密码为上述中更改后的密码以操作系统用户omm登录数据库主节点,输入启动服务,输入,显示如下结果,则表示启动成功。连接数据库,输入,显示如下结果则表示连接成功。【为openGauss安装

2023-05-10 09:51:00 1075

原创 pycharm怎么debug调试

5.step out(Shift+F8):当执行子函数a时,选择该调试操作可以直接跳出子函数a,而不用继续执行子函数a中的剩余代码。Console窗口的工作模式:当我们需要查看程序给出的错误信息,或者进行一些额外的临时运算时,就需要在这个窗口里面进行。1.show execution point (F10):显示当前所有断点,回到正在运行的断点对应代码行。(2)断点对应代码行变蓝,程序进程已经到达断点处,但尚未执行断点所标记的代码。显示属性:将鼠标悬停在断点上方,断点的关键信息(行号以及脚本属性)。

2023-04-10 14:44:11 1860 1

原创 深度学习之聚类

聚类(Clustering)是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。

2023-04-03 21:33:51 3401

原创 Git的安装

Git Bash 是基于CMD的,在CMD的基础上增添一些新的命令与功能,平时主要用这个,功能很丰富。

2023-03-27 21:43:19 159

原创 深度学习的性能指标

正样本:属于某一类(一般是所求的那一类)的样本。在本例中是及格的学生。负样本:不属于这一类的样本。在本例中是不及格的学生。困难样本: 预测时与真值标签误差较大的样本。简单样本: 预测时与真值标签误差较小的样本。eg. 图片分类:需要识别马、羊、牛三个类别。给一张马的图片。对于预测马来说这个样本为正样本,对于预测羊和牛来说该样本为负样本。eg. 语音识别:需要识别“我 爱 中 国”四个字。语音片段对应“我”。则对于预测“我”来说这个样本为正样本,对于预测其他字来说该样本为负样本。

2023-03-27 21:32:17 1516

原创 pycharm的terminal怎么使用虚拟环境

【代码】pycharm的terminal怎么使用虚拟环境。

2023-03-23 11:23:06 1809 2

原创 CDF累积分布函数

一般以大写“CDF”(Cumulative Distribution Function)标记。累积分布函数/分布函数:是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。即累积分布函数表示:对离散变量而言,所有小于等于a的值出现概率的和。

2023-03-23 11:17:13 2183

原创 不平衡数据/少数样本下学习困难的原因

样本不平衡分布,内部不平衡(患病患者)+外部不平衡(因隐私收集数据困难)。从极端的类不平衡数据中学习(地震、海啸)。不平衡分布(不平衡率,imbalance ratio,IR)不是分类困难的原因,如果正负类存在良好的代表性,即很好的表示并且来自非重叠分布,也可以获得很好的结果。不平衡的敏感性与问题复杂性有关。非复杂的、线性可分离的问题不受所有级别的类不平衡的影响。可用的少数样本总数 比 不平衡率 更重要。

2023-03-23 10:49:15 175

原创 机器学习-表征学习-深度学习

机器学习本质就是利用机器自动(有部分人为参与的)学习数据特征,从而对于类似输入(相同特征)进行特定任务的预测。如果有人为参与地进行特征处理,我们称之为特征工程;我们可以利用表示学习和深度学习方法使机器学习模型达到模型自己学习特征规律,从而自主提升模型性能的效果。

2023-03-22 18:02:18 506

原创 论文阅读-8-Survey on deep learning with class imbalance

本研究的目的是检验现有的深度学习技术,以解决类不平衡数据。使用不平衡数据进行有效分类是一个重要的研究领域,因为在许多现实应用中,例如欺诈检测和癌症检测,高等级不平衡是固有的。此外,高度不平衡的数据带来了额外的困难,因为大多数学习器会表现出对多数类的偏见,在极端情况下,可能会完全忽视少数类。在过去二十年中,使用传统的机器学习模型(即非深度学习)对类失衡进行了深入研究。尽管深度学习最近取得了进展,但随着它的日益普及,在深度学习领域中,几乎没有关于类不平衡的实证研究。

2023-03-22 18:00:45 531 2

原创 编码器-解码器架构

编码器-解码器架构学习,并举例。

2023-03-22 17:59:04 5521

原创 LC1237. 找出给定方程的正整数解

因此我们从小到大进行枚举 x,并且从大到小枚举 y,当固定 x 时,不需要重头开始枚举所有的 y,只需要从上次结束的值开始枚举即可。

2023-03-03 16:37:49 88

原创 论文阅读-11-Handling Inter-class and Intra-class Imbalance in Class-imbalanced Learning

类别不平衡是机器学习实践中的一个普遍问题。典型的不平衡学习(IL)方法通过直观的类别重采样或重加权来平衡数据。然而,以前的研究表明,除了类别不平衡之外,内在的数据困难因素,如重叠、噪声和小的间断也起着关键作用。为了处理它们,已经提出了许多解决方案(例如,噪声去除、边界采样、困难示例挖掘),但是仍然局限于特定的因素,并且不能推广到更广泛的场景,这提出了一个有趣的问题:如何以统一的方式处理类别不可知的困难和类别不平衡?为了回答这个问题,我们考虑了类不平衡和它的正交:类内不平衡,即简单和困难样本上的不平衡分布。这

2023-03-03 12:57:02 397 2

原创 论文阅读-14-BAGAN:Data Augmentation with Balancing GAN

图像分类数据集通常是不平衡的,这一特征对深度学习分类器的准确性产生了负面影响。提出平衡GAN(BAGAN)作为一种增强工具,用于在不平衡数据集上恢复数据的平衡。这是具有挑战性的,因为少数少数类图像可能不足以训练GAN。我们通过在对抗性训练期间包括大多数和少数类的所有可用图像来克服这个问题。生成模型从大多数类中学习有用的特征,并使用这些特征来生成少数类的图像。我们在潜在空间中应用类条件反射来驱动生成过程朝着目标类前进。GAN 中的生成器使用自动编码器的编码器模块初始化,使我们能够在潜在空间中学习准确的类条件。

2023-03-02 20:39:53 1061 2

原创 论文阅读-16-Class-Balanced Loss Based on Effective Number of Samples

提出有效样本数的概念延伸出损失函数的加权因子(有效样本数的倒数),得到类平衡损失函数

2023-02-24 13:52:50 413

原创 Zotero & BookxNote

文献管理+浏览器+翻译器+笔记整理+思维导图

2023-02-17 11:32:10 769

原创 论文阅读-13-MESA: Boost Ensemble Imbalanced Learning with META-sampler

本文介绍了一种新的集成IL框架MESA。它在迭代中自适应地重采样训练集,得到多个分类器,形成级联集成模型。MESA直接从数据中学习采样策略,以优化最终指标,而不是采用随机试探法。与流行的基于元学习的IL解决方案不同,通过在任务不可知的元数据上独立地训练元采样器,来分离MESA中的模型训练和元训练。这使得MESA普遍适用于大多数现有的学习模型,元采样器可以有效地应用于新的任务。

2023-02-15 15:22:07 293 1

原创 6、面向对象基础

面向对象基础,设计对象,内存机制,构造器,this,封装javabean,综合案例

2022-12-03 17:53:52 398

原创 安装Ubuntu

安装ubuntu 两种(简介+自定义)

2022-11-29 13:39:43 65

原创 1、设计模式介绍

设计模式

2022-11-29 13:08:19 152

原创 5、Java方法

java方法定义,复制,内存,引用类型。实例

2022-11-19 22:06:26 476

原创 4、数组array

Java 数组(静态初始化,动态初始化,注意事项,数组底层原理,数组的应用,内存,认识debug)

2022-11-13 22:49:48 178

原创 3、程序流程控制

java的程序流程控制:if else 、swich-case、for、while、do…while、死循环、break、continue、random等

2022-11-10 22:20:29 106

原创 2、类型转换+运算符+API+Scanner

Java的类型转换,运算符,API(Scanner)

2022-11-09 22:26:56 304

原创 1、Java基础语法

JAVA基础语法

2022-11-09 13:29:51 54

原创 F12控制视频倍速播放

一招搞定,倍速播放

2022-11-08 18:43:20 7495 3

原创 Jupyter Notebook快捷键

JupyterNotebook快捷键

2022-11-07 18:42:37 113

原创 0、Java入门

安装配置JDK+Idea,熟悉IDEA,简单code

2022-11-07 16:39:44 101

原创 安装OfficeTab

安装officeTab,生成页面标签

2022-11-07 15:11:32 1168 1

原创 Office-Microsoft365-家庭和个人版下载和安装

安装Office-Microsoft365-家庭和个人版

2022-11-07 13:52:59 10713 8

原创 论文阅读-1-Rethinking the Value of Labels for Improving Class-Imbalanced Learning

通过标签入手,改善不平衡学习。

2022-11-05 14:32:21 549

原创 将默认安装到C盘的软件安装到其他盘(Xmind Office Chorme)

取消默认安装C盘,安装其他盘

2022-11-05 11:27:40 2648 2

论文标准格式-更改页眉和封面

论文标准格式-更改页眉和封面

2022-11-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除