自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 基于重要抽样的主动学习不平衡分类方法ALIS

这篇论文讨论了数据分布不平衡对分类器性能造成的影响,并提出了一种新的有效解决方案 - 主动学习框架ALIS。1、数据分布不平衡会影响分类器的学习性能。现有的方法主要集中在过采样少数类或欠采样多数类,但往往,无法有效解决严重的类别不平衡问题。2、论文提出了ALIS框架,它通过交替进行和,使得两种采样策略相互影响和改善。3、,从而大幅提高分类器的性能。传统方法缺点:基于采样的技术一直是通过增加少数类实例(过采样)或减少多数类实例(欠采样)来缓解不平衡问题的一种直接而简单的方法。

2024-07-19 17:14:22 672

原创 主动学习综述

主动学习的主要目的是在保证分类器精度不降低的前提下尽量降低人工标注的成本主动学习算法通过迭代方式在原始样例集中挑选可以提升模型性能的样例进行专家标注,并将其补充到已有的训练集中,使被训练的分类器在较低的标注成本下获得较强的泛化能力。

2024-07-05 18:36:17 674

原创 经典混合采样方法------BDSK(基于聚类的混合采样)算法总结

该算法结合Smote过采样算法和基于K-均值的欠采样算法,解决了类内不平衡问题和类间不平衡问题。该方法不仅避免了噪声过大的问题,而且解决了样本不足的问题。

2024-07-01 17:17:24 214

原创 AdaBoost-SVM-MSA 算法总结

AdaBoost-SVM-MSA 算法按一定规则将SVM分错的样本划分成噪声样本、危险样本与安全样本,然后直接删除噪声样本,采用约除法处理危险样本,并对安全样本进行 SMOTE 过采样。

2024-07-01 15:44:10 222

原创 ADASYN算法总结

ADASYN 算法根据少数类样本的分布自适应地改变不同少数类样本的,自动地确定每个少数类样本需要合成新样本的数量,,从而补偿偏态分布。

2024-06-28 19:37:47 301

原创 Borderline-SMOTE算法总结

少数类的类标签定义为正(positive),多数类的类标签定义为负(negative)Tp:被正确分类的正例的数量Tn:被正确分类的反例的数量Fn:表示错误分类的正例的数量Fp:表示错误分类的反例的数量:作为评估基础,混淆矩阵展示了分类结果与实际标签之间的对应关系,其中TP(真正例)、TN(真负例)、FP(假正例)、FN(假负例)是核心组成部分。:公式(1)定义了准确率,但在高度不平衡的数据集中,准确率可能因多数类的表现而偏高,无法真实反映少数类的分类效果。

2024-06-26 19:28:54 944

原创 SMOTE算法的改进与扩展

只考虑分布在分类边界附近的少数类样本,并将其作为根样本首先通过 k-NN 方法将原始数据中的少数类样本划分成“Safe”、“Danger”和“Noise”3 类,其中“Danger”类样本是指靠近分类边界的样本。对属于“Danger”类少数类样本进行过采样,可增加用于确定分类边界的少数类样本。这样做可以增加这些关键区域的少数类样本数量,使得模型在训练时有更多机会学习到分类边界的确切位置,从而提升对少数类的识别能力,减少误分类。

2024-06-25 18:57:52 1146

原创 机器学习基本概念清单

损失函数就是机器学习中用来度量模型预测结果与期望目标之间差距的一种工具,它通过计算“罚分”来告诉模型在哪些地方做错了,以及错得多严重,从而引导模型在训练过程中逐步改进,提高其完成任务的能力。上面的损失函数就是用来计算评分当损失函数中含有对数函数、指数函数等,损失函数叫做超越方程,往往没有解析解,此时需要最优化分析中的搜索逼近来求解。其中最常用的一种算法就是梯度下降梯度就是函数曲面陡度偏导数是具体方向的陡度梯度是所有方向偏导数向量和。

2024-04-21 14:18:03 261 1

原创 力扣(leetcode)45、跳跃游戏2超详细题解,经典贪心算法

所以在范围区间内部某点(记为a)即使有跳的更远的地方,则maxPosition也会保留下来,我们就可以认作上次跳跃是从start-a (含有一个step),a-maxPosition,因为start可以跳到最远的end,也就可以跳一步跳到a。的范围内,我们维护一个maxPosition,表示能跳到的最远距离,每次遍历maxPosition = Math.max(maxPosition, i + nums[i]);下一次跳跃的最远距离在哪?这样每到达一个边界的时候,我们就结束了当前跳跃,而进入到下一次跳跃。

2024-03-30 19:26:32 347

原创 ICD编码论文阅读-利用语篇结构和协调代码嵌入的自动ICD编码

1. 现有的研究并没有利用语篇结构的临床笔记,其实这提供了丰富的上下文信息可用于代码分配所以本篇论文利用了2. 还关注了类别不平衡的问题 以及 临床笔记和ICD代码定义之间的异构写作风格。所提出的能够同时处理它们。

2024-03-20 20:00:27 371 1

原创 ICD编码论文综述阅读-A Review on Deep Neural Networks for ICD Coding(用于ICD编码的深度神经网络综述)

这一部分在前面总结了ICD编码任务的特点后,将其数学形式化为多标签文本分类问题,并给出了解决该问题的基本过程和方法。制定ICD编码任务并提供端到端框架,详细介绍了词嵌入和深度神经网络的理论ICD编码建模为一种极端多标签分类任务。其目标是学习一个分类器,能够从极大数量的ICD编码中自动地对临床文档进行最相关的子集标签的注释。单标签分类是指每个样本只能被分配一个标签,而多标签分类是指每个样本可以被分配多个标签。在单标签分类中,每个样本与一个唯一的标签相关联,而在多标签分类中,每个样本可以与多个标签相关联。

2024-03-08 21:54:28 1055 1

原创 SpringBoot快速整合RabbitMQ实现MQ最基本操作

同时Binding还要记录exchange与queue的路由规则,也就是什么样的路由规则才会通过这个exchange到达queue。注意:只要引入了amqp依赖starter,则RabbitAutoConfiguration就会自动生效,这个配置类给容器中自动配置了RabbitTemplate AmqpAdmin CachingConnectionFactory RabbitMessagingTemplate等,这些是可以通过@Autowired拿来直接使用的。创建交换机Exchange。

2024-01-14 22:12:46 569 1

原创 深度剖析单点登录流程原理,从0带你手写一个SSO

1.登录之后携带令牌,标明自己是否登录2.未登录则需要进行登录认证,中央认证服务发放token3.通过cookie的方式存入token,实现跨系统、跨域名的存储token(这一步存在一些安全隐患等等,如cookie窃取、篡改等,自己在做更加完备的单点登录时可以考虑其他方案)

2023-12-24 17:35:20 1013 1

原创 深入理解 Spring Session:实现分布式会话管理(含详细步骤)

Spring Session 是 Spring 框架的一个项目,旨在提供会话管理的解决方案。它可以与各种后端存储(如内存、数据库、Redis 等)集成,以便将会话数据存储在可扩展的分布式环境中。Spring Session 不仅可以用于传统的 Web 应用程序,还可以用于微服务架构中的分布式系统。

2023-12-22 17:45:21 2306

原创 详细解读ThreadPoolExecutor类的七大构造参数

ThreadPoolExecutor是Java中用于管理线程池的类,它提供了一种方便的方式来执行多线程任务。ThreadPoolExecutor的构造参数有很多,每个参数都有不同的作用和影响,下面我将详细解读每个构造参数,并尽量用通俗的语言解释它们。首先需要明白,线程是要去执行特定任务的,这些任务通常是特定的代码段,我们需要将代码段封装成一个任务(比如Runnable),将其交给线程去执行任务。而我们的线程池就装载了一些线程,一旦有任务来临,就可以从线程池中取出线程去执行我们的任务。

2023-12-06 19:20:17 185 1

原创 超详细讲解Spring-IOC、DI、AOP概念并通俗解释

IOC 让我们不再主动管理对象和依赖关系,而是交给容器去做;DI 让我们不再主动获取依赖的对象,而是由容器来注入;AOP 让我们不再重复写一些共同的功能代码,而是把它们整合在一起来管理。这些概念的引入,使得程序的开发更加灵活、易于扩展和维护。

2023-12-02 12:46:56 603 2

原创 Spring入门案例

首先,您需要安装Java和Maven,并且确保环境变量已经配置好。此外,您还需要安装一个IDE,比如Eclipse或者IntelliJ IDEA等。

2023-12-02 12:14:50 33 1

原创 超详细避免IP地址自动更换,修改CentOs7为固定IP地址

刚安装好的CentOs7会出现IP地址自动被更换的问题,比如虚拟机重启、间隔一段时间.....IP地址就会发生变换。下面将详细把CentOs7设定为静态IP来解决该问题,耐心看完,不墨迹,只为解决。建议使用ifconfig命令查询当前CentOs7IP地址,并设置成这个地址。将IPADDR设置为你想要使用的静态IP地址(要求与主机IP在同一网段下)执行命令出现以下结果表示能ping通baidu即为成功。例如,如果你的网关IP地址是。DNS1直接按照以下方式修改。执行命令查询网关IP地址。

2023-11-01 16:25:29 783

原创 ElasticSearch倒排索引机制

例如,如果一个文档中包含“汽车”和“安全”两个词汇,那么倒排索引中就会存储“汽车”->文档1、“安全”->文档1的信息。例如,如果用户查询关键词"喜欢开车",我们可以通过倒排索引快速找到文档1和文档2,因为它们包含了"喜欢"和"开"这两个关键词。文档3: ["我", "喜欢", "骑", "自行车"]文档1: ["我", "喜欢", "开", "快车"]文档2: ["我", "喜欢", "开", "慢车"]"喜欢" -> [文档1, 文档2, 文档3]"我" -> [文档1, 文档2, 文档3]

2023-10-31 17:30:08 52

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除