iKang_dlut-CSDN博客

原创 java尖括号类型匹配

按照我的理解，右边的始终应该比左边具体，右边是ArrayList，左边就应该是List，现在最内层，右边是List，左边是ArrayList，左边比右边具体了，就抽象了。这个错误的原因是使用了 List<ArrayList<Integer>> levelListAll = new ArrayList<List<Integer>>();这与声明的类型不匹配，因为声明的类型期望使用的是。在这段代码中，问题在于声明的变量类型和初始化的类型不匹配。类型的对象，其中的每个元素都是。，以匹配初始化时使用的类型。

2024-03-13 16:29:24 491

原创什么是rouge metric

举个例子，在一个seq2seq模型中，黄金标签是“police killed the gunman”，模型输出是"the gunman police killed"，两句话的意思是有差别的，但是从unigram的角度，它们都包含了"The", "police", "killed", "gunman"，是完全相同的。以常用的分类指标precision, recall, f1为例。

2024-02-25 12:47:24 405

原创代码随想录第15题三数之和去重理解

nums[i-1]这个条件是不是太过严苛，会不会导致遗漏三元组，答案是不会。而如果nums[i]=nums[i-1]，可以理解为这时nums[i]开头的三元组集合只会是nums[i-1]开头三元组集合的子集，因为遍历区缩小了。周文王打仗时，会把军队分为左军，中军，右军。i可以理解为当前作为左军的人员，i-1可以理解为上一次战斗作为左军的人员，当左军都不同，整个军队也会不同，这就是马哲里的部分不同，整体也会不同。但是本题要求不能出现重复的三元组，例如[[0,0,0],[0,0,0]] 这种结果是不可取的。

2024-02-08 10:46:30 391

原创 GPT原始论文：Improving Language Understanding by Generative Pre-Training论文翻译

自然语理解包括文本蕴含、问题回答、语义相似性评估和文档分类等一系列多样化的任务。尽管大量未标注的文本语料库很丰富，但用于学习这些特定任务的标注数据却很稀缺，这使得基于区分性训练的模型难以充分发挥作用。我们展示了通过在多样化的未标注文本语料库上对语言模型进行生成式预训练，随后对每个特定任务进行区分性微调，可以实现这些任务的大幅度改进。与以往的方法不同，我们在微调过程中使用了任务感知的输入转换，以实现有效的迁移，同时几乎不需要改变模型架构。我们在自然语言理解的广泛基准测试上证明了我们方法的有效性。

2024-02-04 17:04:42 1521

原创 anaconda prompt中pip各种报代理错误解决方案

先关闭clash，然后重启anaconda prompt窗口即可。

2024-01-30 13:42:44 447

原创 Emotion Cause Extraction on Social Media without Human Annotation

为了解决以上这两个问题，本篇文章提出了两种改进策略。实验结果证实了在无监督和弱监督场景下，作者的方法相比于其他方法具有优势。

2024-01-29 16:47:26 783

原创自然语言处理，基于预训练语言模型的方法，车万翔，引言部分

随着互联网的迅速发展，产生了各种各样的用户生成内容（User Generated Content，UGC），其中很多内容包含着人们的喜怒哀惧等情感，对这些情感的准确分析有助于了解人们对某款产品的喜好，随时掌握舆情的发展。之后，Siri在和用户的不断对话中，会不断跟踪当前用户语义和状态，例如用户想将机票从北京改到上海，Siri会在槽值中，将到达地所在槽对应的值修改为上海。Siri会首先解析并理解用户的请求，分析用户的语义，获得用户的领域为机票，意图为订机票，并将关键信息存入槽值构成的列表。

2024-01-27 11:32:42 1211

原创加1平滑(折扣法的一种)损有余而补不足

采用加1平滑，补不足，增加那些从来没有出现过的n-gram的出现概率（之前利用频次估计的概率可能为0，即不可能事件，太过绝对，加1使冷门n-gram概率估计很小但不为0）；同时损有余，削弱热门n-gram的出现概率（类比于王者荣耀的强势英雄，所有英雄都加强了，强势英雄相对就削弱了，或者是一个分数，分子增加了1，但是分母增加了100，分数的值也即出现概率相对也就缩小了）。极端情况下，当字串就是文档本身，或者文档除去最后一个词外的所有词，这时频次为1，估计的偶然性较大。的条件下，对下一时刻t可能出现的词。

2024-01-23 22:52:47 365

原创环形列表II 一刷

环形列表的一点个人思考

2024-01-17 23:39:15 375

原创对话组组会记录

2024-01-16 16:31:24 351 1

原创国内可用的GPT API

网址https://www.closeai-asia.com/dashboard。

2024-01-16 16:26:00 484 1

原创 Multi-Graphs/Multi-Dimensional Edges: TensorGCN, ME-GCN

这两种模型都旨在利用文本数据中的语义和关系信息，以支持各种自然语言处理任务。TensorGCN强调语义、句法和顺序信息的整合，而ME-GCN关注多维嵌入和边的构建。它们都使用图神经网络（GCN）来进行信息传播和学习。

2024-01-15 22:14:11 325

原创 BLIP2源码阅读-LAVIS/app/init.py

可以把使用频率较高的一部分，如你最喜欢的那本或者你平时最常使用的那本，保存到一个触手可及的地方，如身边书架上，这样使用起来就会节省时间。device定义了模型在gpu上运行（如果gpu可用的话，即torch.cuda.is_available()），否则模型在cpu上运行，运行的速度会变慢。综上所述，这行代码的作用是从给定的网址下载图片，并将其转换为RGB模式，以便于进一步处理或显示。对象的一个属性，它提供了原始的响应内容（在这个情况下是图片的数据）。最后返回转换后的demo图片，供后续展示使用。

2024-01-15 22:01:29 516

原创 Linux命令记录

pip3 list的输出是一段包的列表，里面有所有已经使用pip安装的包，包的名称存放在列表中。在使用python安装matplotlib时，使用这样一条命令。然后使用grep命令去检索包含matplotlib的行。

2023-12-10 12:48:47 412 3

原创 BertTokenizer.from_pretrained(configs.bert_cache_path)是什么

方法、加载权重和配置、实例化分词器对象以及进行分词处理这几个步骤来完成的。这个过程可以确保我们在使用 BERT 或其他基于 Transformer 的模型进行自然语言处理任务时，能够利用已经在大量数据上训练过的分词器来提高性能。总之，预训练分词器的加载过程是通过指定路径、调用。

2023-12-07 16:50:10 514 2

原创机器学习，什么是一个epoch

在这个过程中，模型会尝试学习数据集中的所有样本，并根据损失函数更新其权重。通常，一个epoch包含多个训练步骤（或称为batches），每个步骤都会将一小部分数据输入模型进行训练。完成整个数据集的训练后，模型将进行一次验证或测试，以检查其在未见过的数据上的性能，这有助于评估过拟合和泛化能力。在深度学习和机器学习中，一个epoch表示将整个训练数据集通过神经网络一次（即进行一次正向传播和一次反向传播）的过程。然后，可以根据需要重复多个epoch来进一步提高模型的性能。

2023-12-07 16:17:41 621

原创预热步数学习博客

预热步数表示在训练开始时的一个阶段，学习率会逐渐增加到预设的最大值，然后开始逐渐减小。这个阶段有助于模型训练的稳定性。简单来说，这行代码计算出了在整个训练过程中，学习率逐渐增加的那个阶段的步数。表示预热步数，它是在训练深度学习模型时的一个重要参数。相乘，我们得到了预热步数。通过将总梯度更新次数。

2023-12-07 15:59:14 390

原创关于num_steps_all = len(train_loader) // configs.gradient_accumulation_steps * configs.epochs的理解，文心一言

所以，你总共会看 100 × 3 = 300 张纸。但由于你每看5张纸才更新一次参数，所以你实际上会更新 300 ÷ 5 = 60 次参数。这行代码就是在做这样的计算：它算出在整个训练过程中，模型参数会更新多少次。希望这样的解释能帮助你理解！这行代码计算的是在整个训练过程中，模型参数会更新的总次数。当然可以，我会尽量用简单的语言来解释这行代码。

2023-12-07 15:50:04 530

原创 UniCOQE: Unified Comparative Opinion Quintuple Extraction as A Set

比较意见五元组提取(COQE)旨在识别产品评论中的比较意见句子，提取句子中的比较意见元素，然后将其纳入五元组。现有的方法将COQE任务分解为多个主子任务，然后以管道的方式解决它们。然而，这些方法忽略了子任务之间的内在联系和阶段之间的错误传播。为了一次性解决COQE任务，本文提出了一种统一的生成模型UniCOQE。我们设计了一个生成模板，其中所有比较元组被连接作为目标输出序列。然而，多个元组本质上不是有序序列，而是无序集合。预先定义的顺序会迫使生成模型学习错误的顺序偏差，从而影响模型的训练。为了减轻这种偏见，

2023-12-07 14:59:13 930

qq_46805255的博客