自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(230)
  • 收藏
  • 关注

原创 Joint Entity and Relation Extraction with Span Pruning and Hypergraph Neural Networks

介绍了一种基于超图神经网络的新方法用于实体和关系抽取。该方法通过高召回率的剪枝机制缓解了错误传播问题,并通过构建超图实现高阶建模。实验结果表明,该方法在多个基准数据集上显著优于之前的最先进模型PL-marker。

2024-05-22 09:20:51 309

原创 Improving Named Entity Recognition for Chinese Social Media with Word Segmentation Representation Le

这段文字的意思是描述了一个联合模型的结构,该模型通过共享LSTM模块的参数实现中文分词和NER任务的联合训练。左侧的LSTM模块处理词语分割任务,右侧的CRF模型处理NER任务,并且可以访问LSTM生成的表示。,这段文字的意思是通过将最先进的中文分词系统和中文社交媒体NER模型进行整合,并对它们的学习表示进行联合训练,可以显著提升NER系统的性能,尤其是在中文社交媒体文本处理方面。,这段文字的意思是通过将词语分割和NER任务联合训练,可以显著改善NER系统的性能,特别是在中文社交媒体的文本处理中。

2024-05-22 09:11:14 583

原创 Nested Entity Recognition Fusing Span Relative Position and Region Information

目前,基于跨度的实体识别方法主要用于准确识别实体的边界(即跨度边界),但通常忽略了跨度边界的相对位置信息和跨度区域内的词汇信息。这些信息可以用来提高实体识别的性能。因此,本文提出了一种嵌套实体识别模型,该模型整合了跨度的相对位置信息和跨度内区域的信息。

2024-05-19 17:20:42 581

原创 Incorporating Entity Type-Aware and Word–Word Relation-Aware Attention in Generative Named Entity Re

命名实体识别(NER)是自然语言处理中的一个关键子任务。当解决NER问题时,深入理解实体边界和实体类型尤为重要。大多数以前的序列标注模型都是任务特定的,而近年来,由于在编码器-解码器框架中处理NER任务的优势,生成模型逐渐兴起。尽管生成模型取得了不错的表现,我们的初步研究表明,现有的生成模型在检测实体边界和估计实体类型方面效果不佳。本文提出了一种多重注意力框架,引入了实体类型嵌入和词-词关系的注意力机制到命名实体识别任务中。

2024-05-18 16:33:50 629

原创 ppt---C语言

注意某些符号和我们手写的不一样()乘法,除法等。

2024-05-11 17:40:11 165

原创 c语言教程--day1

在C语言中,main函数是程序的入口点,是程序执行的起点和结束点。Eclipse:Eclipse 是另一个功能强大的集成开发环境,虽然它最初是为 Java 开发设计的,但通过安装 C/C++ 插件,可以使其支持 C 语言开发。Vim 和 Emacs:这两个是传统的文本编辑器,它们有着强大的编辑功能和高度的可定制性,对于熟练的用户来说非常强大,有很多插件和配置可以支持C语言的开发。Atom:Atom 是一个开源的文本编辑器,由 GitHub 开发,它有很多插件和主题,可以定制为一个适合 C 语言开发的环境。

2024-05-11 17:20:09 736

原创 An Embarrassingly Easy but Strong Baseline for Nested Named Entity Recognition

使用基于跨度的方法来处理嵌套 NER,其中大多数方法将得到一个 n × n 的分数矩阵,其中 n 表示句子的长度,每个条目对应一个跨度。尽管方法简单,但在三个常用的嵌套 NER 数据集上的实验表明,该模型超过了几种最近提出的具有相同预训练编码器的方法。作者指出,将跨度特征矩阵视为图像可以启示未来基于跨度的方法对嵌套 NER 任务的探索。研究发现,不同的论文对三个嵌套 NER 数据集使用不同的句子标记方法,这会影响比较。作者发现在嵌套 NER 任务中,相邻的跨度之间存在一些特殊的相关性。

2024-05-08 16:24:19 230

原创 UTC-IE: A Unified Token-pair Classification Architecture for Information Extraction

作者进一步将这些任务分解为使用跨度的开始和结束标记来确定跨度的令牌对分类任务,并使用两个跨度的开始到开始和结束到结束的标记对来确定它们之间的关系。解决IE任务的范例:过去十年中,许多范例被提出来解决IE任务,包括序列标注、基于跨度的分类、基于机器阅读理解(MRC)的方法和基于生成的方法等。所有的信息抽取(IE)任务都可以分解为令牌对分类任务。IE的定义和任务:IE旨在从非结构化文本中识别和分类结构化信息,包括命名实体识别(NER)、联合实体关系提取(RE)和事件提取(EE)等各种任务。

2024-05-08 15:29:57 281

原创 PromptNER: Prompt Locating and Typing for Named Entity Recognition

ACL2023。

2024-05-07 11:08:39 326

原创 《Boundary Smooth for NER》

基于边界存在的问题,参考 Label Smoothing,作者提出了 boundary smoothing 的训练方法,即使用 biaffine 模型得到 span 分数,在求出的概率矩阵上进行 boundary smoothing,重新分配 span 标注的的概率。在数据集中,正样本被离散的分配到这些候选span上,原始数据集中一共有378万的候选span,但是仅有3.5w的实体,也就是说正样本只有0.93%,通过标签平滑将可能性分配给标注实体周围的span,也可以缓解原始数据集中正负样本不平衡的问题。

2024-05-06 12:00:49 135

原创 Cross-Domain Contract Element Extraction with a Bi-directional Feedback Clause-Element Relation Netw

单词级别和字符级别的嵌入向量可以通过拼接或者叠加操作来组合成句子的综合表示形式,然后Sequence Encoder将会处理这个组合表示形式,并生成固定长度的表示,用于后续的分类任务。探索了要素和条款之间的关系, 设计了一种双向反馈条款要素关系网络 (bi-directional feedback clause-element relation network, Bi-FLEET), 有效提升合同要素抽取的精确度.子句-元素关系编码器:由源域和目标域共享,并计算条款和元素类型的表示。

2024-05-06 11:59:20 308

原创 SCL-RAI: Span-based Contrastive Learning with Retrieval Augmented Inference for Unlabeled Entity Pr

4. 提出的方法在两个真实世界数据集上的F1得分分别比之前的最优方法提高了4.21%和8.64%。问题:在命名实体识别(NER)中,未标记的实体问题如何影响NER性能?

2024-05-05 19:06:27 155

原创 《DiffusionNER: Boundary Diffusion for Named Entity Recognition》

mith”或“Ne…然后,模型会尝试通过学习的逆扩散过程去除这些噪声,以尽可能准确地恢复原始的实体边界,即“John Smith”和“New York”。这个过程可以类比为在文本中“扩散”实体的边界,将不清晰的边界变得更加清晰,并从中生成完整的实体。总的来说,这段文字介绍了扩散模型在自然语言理解领域的应用和相关研究,并指出了 DIFFUSIONNER 的创新之处及其在离散文本序列任务中的应用。在推断阶段,模型可以从一个先验的高斯分布中抽样一些噪声跨度,并利用学到的逆扩散过程来生成完整的实体边界。

2024-04-26 14:35:14 1003 1

原创 《A Boundary Offset Prediction Network for Named Entity Recognition》

因此,这段文字建议,为了更全面地理解文本中的实体,我们需要设计一种方法来不仅关注实体的识别,还要考虑实体与非实体之间的语义关系。问题:在命名实体识别(NER)任务中,传统的基于跨度的方法通常将实体类型分配给文本跨度,导致样本空间不平衡,并忽略了非实体与实体跨度之间的关联。综上所述,该方法通过预测候选跨度与最近实体跨度之间的边界偏移量,建立了非实体与实体跨度之间的关联,提高了NER的性能。跨度方法忽略了非实体与实体之间的关系:当前的跨度方法主要关注于学习非实体和实体之间的区别,而忽略了它们之间的关系。

2024-04-26 12:00:17 336

原创 A Neural Span-Based Continual Named Entity Recognition Model

论文链接:https://arxiv.org/abs/2302.12200代码:https://github.com/Qznan/SpanKL。

2024-04-22 23:12:56 1022

原创 跑代码跑到一半停掉了

用这个命令让他挂后台运行。

2024-04-22 14:48:10 285

原创 python--my-split()按照切分符号切分,并且保留切分符号

【代码】python--my-split()按照切分符号切分,并且保留切分符号。

2024-02-26 10:24:28 261 1

原创 计算机网络---知识点

路由算法、路由协议,AS,内部网关协议(RIP、OSPF、EIGRP、IS-IS)和外部网关协议(BGP)、MPLS与SRv6。IPv4:地址(分类)、报文、子网、前缀、CIDR、地址聚合、路由聚合、ICMP,ARP,RARP,DHCP,报文格式。IEEE 802.11 (a、b、g、n、ac、ax)工作频率、工作方式、技术演进路线。主动网络、SDN(核心思想、Openflow理解、VxLAN)网络性能的主要指标(延迟、丢包率、吞吐量、抖动)IPv6:地址(分类、地址分配)、报文格式。

2024-01-02 20:48:29 740

原创 计算机网络--作业

1、比较电路交换、报文交换和分组报文交换优缺点电路交换电路交换是以电路连接为目的的交换方式,通信之前要在通信双方之间建立一条被双方独占的物理通道(由通信双方之间的交换设备和链路逐段连接而成)。优点:①由于通信线路为通信双方用户专用,数据直达,所以传输数据的时延非常小②通信双方之间的物理通路一旦建立,双方可以随时通信,实时性强。③双方通信时按发送顺序传送数据,不存在失序问题。④电路交换既适用于传输模拟信号,也适用于传输数字信号。⑤电路交换的交换设备(交换机等)及控制均较简单。

2024-01-02 20:36:36 2238 1

原创 软件工程期末复习习题

已将软件管理和工程两方面的过程文档化、标准化,并综合成该组织的标准软件过程。所有项目均使用经批准、剪裁的标准软件过程来开发和维护软件,软件产品的生产在整个软件过程是可见的。

2023-12-30 21:56:45 2182

原创 计算机网络

14.ISO/OSI 网络体系结构(1)物理层:在物理媒体上传输原始的数据。(2)数据链路层:将数据分成一个个,以数据帧为单位传输。。(3)网络层:将数据分成一定长度的分组,将分组穿过通信子网,从信源选择路径后传到信宿。(4)传输层:提供不具体网络的高效、经济、透明的端到端数据传输服务。(5)会话层:进程间的对话也称为会话,会话层管理不同主机上各进程间的对话。(6)表示层:为应用层进程提供格式化的表示和转换数据服务。(7)应用层:提供应用程序访问OSI环境的手段。

2023-12-27 16:26:26 1021 1

原创 计算机网络--名词解释,简答,填空

1.OFDM 2.IOT 3.PON 4.CIDR 5.SDN 6.对等通信 7.协议数据单元(PDU)8.电路交换9.报文交换10.分组报文交换 11.数据报12.信道复用技术 13.时分复用(TDM) 14.码分复用(CDM) 15.能量感知路由16.超网 17.安全审计 18.P2P 19.无状态自动配置 20. M2M 21.第三层交换 22. WSN 23.冲突窗口 24.计算机取证1、OFDM:即正交频分复用技术,实际上。通过频分复用实现高速串行数据的。

2023-12-25 16:55:46 1222

原创 软件工程期末复习

A2: 如果该借阅者所借图书已经超期,则提示,本次拒借.③系统检验借书证编码,如果正确,则显示借阅者的信息。C 参与者是系统的一部分,是用例图的重要组成部分。A 参与者是与所建立系统交互的人或物。B 参与者可以是人,也可以是其他系统。② 系统要求输入借阅者的借书证编码。D 参与者和用例之间存在泛化关系。④ 系统要求输入所借图书的条码。⑤ 系统显示所借图书的信息。C 参与者之间存在泛化关系。D 参与者之间存在泛化关系。●参与者:管理员,借阅者。1、下面说法错误的是:D。A1:借书证编码有错。

2023-12-21 18:12:42 1087

原创 研究生英语期末考试复习--作文(主题:love,marriage,GM food, computer, work)

爱情和婚姻,虽然经常被放在同一框架中,但它们实际上是两个截然不同的概念。爱情如同初春的花朵,充满了激情和浪漫,而婚姻则是一座建立在承诺和责任之上的坚实之楼。有人说婚姻可能是爱情的坟墓,但也有人认为它是爱情的保障。事实上,婚姻的走向并非注定,而是取决于夫妻双方的共同努力。要在婚姻中保障爱情,首先,需要双方共同努力。这不仅仅是一份契约,更是一场相互理解和尊重的智慧之旅。其次,夫妻之间的默契和包容是婚姻生活中的润滑剂,能够化解矛盾,保持感情的新鲜和活力。

2023-12-18 08:48:24 938

原创 计算机网络--真题

ADSL是用户端的技术,通过ADSL调制解调器,用户可以接入互联网服务提供商的网络,以便在电子邮件、浏览网页、下载文件等方面进行在线活动。FTP 是一种标准的网络协议,用于在计算机之间传输文件。通常用bit来作数据传输的单位,因为物理层,数据链路层的传输对于用户是透明的,而这种通信传输是基于二进制的传输。在应用层通常是用byte来作单位,表示文件的大小,在用户看来就是可见的数据大小。调制解调器(Modem):调制解调器是必需的设备,用于将个人计算机的数字信号转换为模拟信号,以便通过电话线进行传输。

2023-11-01 09:45:38 477

原创 计算机网络--第一次作业

值得注意的是,目的IP地址是远程服务器的地址,但是目的MAC地址是本局域网网关的MAC地址,所以在跨局域网的远程通信中无法获取远程端的MAC地址,数据分组在网络中的传输的过程中,网络设备在转发时会将数据帧的源MAC地址替换为自己的MAC地址,将目的MAC地址替换为路由下一跳网络设备的MAC地址。报文交换是以报文为数据交换的单位,报文携带有目标地址、源地址等信息,报文整个地发送,一次一跳,在交换结点采用存储转发的传输方式,即将到达交换机的分组先送到存储器暂时存储和处理,等到相应的输出电路有空闲时再送出。

2023-10-28 18:05:51 779 1

原创 软件工程17-18期末试卷

对于CMMI-DEV模型的22个过程域,每个过程域都有明确的实践目标和一些最佳实践,具体到一个特定企业,需要根据该企业的商业目标和自身情况,来确定采取哪些方法和行动来达成CMMI模型提出的实践要求。所以,描述中的"视图与控制器是一对多的关系,而模型与视图是一对一的关系"是不准确的。5.界面设计除了设计人(例如,用户)和计算机间的界面,即人机界面设计(例如:用户界面-User Interface)外,还包括设计软件构件间的接口、设计模块和其他非人的信息生产者和消费者(例如,其他外部实体)的接口。

2023-10-25 15:28:34 468

原创 阅读论文Parallel Instance Query Network for Named Entity Recognition

在命名实体识别(NER)任务中,“gold entities” 指的是已知的、正确的命名实体,如人名、地名、组织名等。它指的是作为标准或黄金标签的、在文本中被认可的实体。NER被视作手动构建查询语句来提取实体的阅读理解任务,但是每个查询语句提取一类实体不够高效,提取不同类型的实体缺乏考虑实体间的关系,查询语句构建依赖于外部知识难以应用到有多种类型实体的真实场景中。同样,在信息抽取任务中,“gold entities” 可能是已知的实体,如事件、关系或属性,可以用于模型的训练和评估。

2023-10-18 16:14:54 244

原创 hugging face tansformer实战篇-阅读理解任务

【代码】hugging face tansformer实战篇-阅读理解任务。

2023-10-16 11:35:28 135

原创 阅读《QAnet》QANET: COMBINING LOCAL CONVOLUTION WITH GLOBAL SELF-ATTENTION FOR READING COMPREHENSION Ad

当前端对端的QA模型主要构建在循环神经网络上并结合attention。虽然成功,但是训练速度慢。因此,提出的QANet模型,无需循环网络,其encoder=卷积+self-attention,提升了训练速度(3x->13x)和推理速度(4x->9x)。进而,可以训练更多数据。结合了翻译模型的反向翻译生成的数据,做数据增强,得到F1:84.6(原本:81.8).数据:SQuAD 数据集学术会议:ICLR 2018。

2023-10-11 19:14:10 86

原创 bert----学习笔记

一个简单基础模板:bert导入,分词,编码。

2023-10-09 22:25:24 257

原创 论文阅读---REALISE model

Tokenizer是一种文本处理工具,用于将文本分解成单个单词(称为tokens)或其他类型的单位,例如标点符号和数字。常用的tokenizer包括基于规则的tokenizer和基于机器学习的tokenizer,其中基于机器学习的tokenizer可以自动识别单词和短语的边界,并将其分解为单个tokens。GRU和LSTM在很多情况下实际表现上相差无几,那么为什么我们要使用新人GRU(2014年提出)而不是相对经受了更多考验的LSTM(1997提出)呢。

2023-08-29 16:43:14 1396

原创 seq2seq、attention、self-attention、transformer、bert

首先,训练第一个任务是,随机遮挡单词,然后通过梯度下降调参,让predict与被遮挡的单词尽量接近,所以这个训练无需人工标注,训练集自动生成,模型自动训练好参数。bert是为了预训练Transformer中的encoder, bert其实就是只有编码器的transformer。本文推荐看看shusenwang在bilibili上的课程。然后,训练第二个任务是,判断两个句子是否相连接。bert想法简单效果好,但是计算量特别大。

2023-07-21 17:49:32 464

原创 html,css初学

安装VSCODE ,插件:live server ,html support。

2023-07-21 13:25:16 376

原创 springboot静态资源访问、文件上传、拦截器

在static中过滤规则/static/**静态资源位置classpath:/static/文件放在static下,就可以直接访问了。

2023-07-20 15:11:20 338

原创 springboot controller

一般分为View层、Controller层、Service层、Mapper层、pojo层。View层:视图层,根据接到的数据展示页面给用户Controller层:响应用户需求,决定用什么视图,需要准备什么数据来显示。Controller层负责前后端交互,接收前端请求,调用Service层,接收Service层返回的数据,最后返回具体的数据和页面到客户端Service层:Service层也可以分为三个方面。

2023-07-20 13:48:44 291

原创 mybatis和dbeaver安装部署连接测试

将dbeaver工具和mysql进行连接测试,具体操作可以观看bilibili【mysql8.0的下载与安装 DBeaver的下载与使用-哔哩哔哩】 https://b23.tv/2HnFgHy。ORM对象关系映射,把对象和数据库中的数据进行映射。mybatis是orm框架,mybatis-plus是mybatis的增强工具,简化开发。新建数据库,新建表,新建列,设置username为主键,然后再数据中添加数据信息,右键点击test,用sql查询。1.准备mysql数据库。

2023-07-18 12:03:31 285

原创 VUE安装部署+应用

教程:https://cn.vuejs.org/guide/quick-start.html#using-vue-from-cdn。安装教程:https://blog.csdn.net/T1401026064/article/details/128692088。3.新建demo文件夹,并且将文件夹拖入vscode,然后再vscode中新建demo.html,根据上面的教程,输入代码。复制链接:https://unpkg.com/vue@3。1.下载vscode。

2023-07-18 10:54:15 207

原创 SPRINGBOOT部署安装&hello world

总结:现在如果改变hello world,改为你好世界,ctrl+s保存后,程序自动运行,做出了修改,以上操作就是为了方便修改后自动运行,简化手动重启的步骤,加快开发效率。3.idea中设置JDK版本号,IDEA中springboot不要选择3.0版本,会出现与jdk不匹配报错的问题。6.安装spring-boot-devtools,方便程序运行,无需重启再次运行,直接运行并加载,即热部署。做完这个后,如果再修改代码,程序会自动重启,选中build project automatically。

2023-07-17 18:54:58 104

原创 pytorch学习指南---安装anaconda ,pytorch

安装命令pytorch:conda install pytorch torchvision torchaudio cpuonly -c pytorch。教程:bilibili up主:一只小土堆。构建pytorch空间。

2023-07-04 17:35:51 992

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除