NLP
文章平均质量分 89
happyprince
这个作者很懒,什么都没留下…
展开
-
[论文阅读笔记70]基于token-token grid模型的信息抽取(5篇)
忽略三元组依赖信息,会造成级联错误与信息冗余,提出了OneRel: 把实体关系联合抽取看成fine-grained triple分类任务来处理,由scoring-based classififier 与 relation-specifific horns tagging strategy组成。效果SOTA。1. 把联合抽取任务转制换成一个粒度三元组分类问题。2. 提出了基于分数分类器与Rel-Spec Horns标注策略的单步联合单模型。评分函数会影响模型效率;在其实信息抽取任务的深探。原创 2022-10-18 02:00:00 · 1209 阅读 · 3 评论 -
[论文阅读笔记69]医学术语标准化-CODER
提出了KG的对比训练模型;对现有医疗嵌入进行评估。zero-shot术语标准化、医学概念相似性度量和概念关系分类任务中实现了最先进的结果( state-of-the-art);CODER是第一个跨语言的医学术语表示,支持英语、捷克语、法语、德语、意大利语,日语、葡萄牙语、俄语、西班牙语、荷兰语和汉语。...原创 2022-08-18 13:47:38 · 1131 阅读 · 0 评论 -
[论文阅读笔记68]Sentence-BERT
sentence-transformers, 模型结构分两种,分类任务;回归任务原创 2022-07-23 15:59:25 · 641 阅读 · 1 评论 -
[论文阅读笔记67]Chinese NER by Span-Level Self-Attention
1. 基本信息题目论文作者与单位来源年份Chinese NER by Span-Level Self-AttentionXiaoyu Dong,Xin Xin,Ping Guo 北京理工大学201915th International Conference on Computational Intelligence and Security (CIS)1 Citations, 20 References论文链接:https://sci-hub.st/https://i原创 2022-03-29 23:30:00 · 1202 阅读 · 0 评论 -
[论文阅读笔记66]R-BERT
1. 基本信息题目论文作者与单位来源年份Enriching Pre-trained Language Model with Entity Information for Relation ClassificationShanchan Wu Yifan He Alibaba Group (U.S.) IncCIKM2019R-BERT128 Citations, 32 References论文链接:https://arxiv.org/pdf/1905.08284.p原创 2022-03-22 00:00:00 · 1285 阅读 · 1 评论 -
[论文阅读笔记65]Template-Based Named Entity Recognition Using BART
1. 基本信息题目论文作者与单位来源年份Template-Based Named Entity Recognition Using BARTLeyang Cui(Zhejiang University),Yu Wu(Microsoft Research Asia),Westlake UniversityACL2021 - Findings202118 Citations, 36 References论文链接: https://aclanthology.org原创 2022-03-05 00:00:00 · 4418 阅读 · 0 评论 -
[论文阅读笔记64]A Unified Generative Framework for Various NER Subtasks
1. 基本信息题目论文作者与单位来源年份A Unified Generative Framework for Various NER Subtasks复旦大学,邱锡鹏组ACL202113 Citations, 70 References论文链接: https://arxiv.org/pdf/2106.01223.pdf论文代码:https://github.com/yhcc/BARTNER2. 要点研究主题问题背景核心方法流程亮点数据集结论原创 2022-03-04 00:00:00 · 5559 阅读 · 11 评论 -
[论文阅读笔记63]Span-based Joint Entity and Relation Extraction with Transformer Pretraining
1. 基本信息题目论文作者与单位来源年份Span-based Joint Entity and Relation Extraction with Transformer Pre-trainingMarkus Eberts ,Adrian Ulges,莱茵曼应用技术大学ECAI201976 Citations, 50 References论文链接:https://arxiv.org/abs/1909.07755论文代码:https://github.com/marku原创 2022-03-03 13:49:01 · 717 阅读 · 2 评论 -
[论文阅读笔记62]KnowPrompt - Knowledge-aware Prompt-tuning with Synergistic Optimization for RE
1. 题目KnowPrompt: Knowledge-aware Prompt-tuning with Synergistic Optimization for Relation Extractionthe paper has been accepted by WWW2022.Alibaba Group && Zhejiang University2. 模型2.1 摘要把关系标签之间的知识整合到关系提取的prompt-tuning中,并提出了一种使用协同优化的Knowledge-原创 2022-02-14 18:01:28 · 2465 阅读 · 1 评论 -
[论文阅读笔记60]Neuralizing Regular Expressions for Slot Filling
题目:Neuralizing Regular Expressions for Slot Filling(神经正则表达实体抽取) 上海科技大学,屠可伟团队摘要:解决Slot Filling任务,通过把符号规则转换神经网络相集成的方法进行研究。整体方案:预备知识:正则表达(略)FST(Fifinite State Transducer,有限状态转换器)查阅相关资料【6】:有限自动机(Finite Automata, FA) 是由一组有限的状态和状态转移的集合组成,其每一个转移原创 2021-11-11 12:59:30 · 625 阅读 · 0 评论 -
[论文阅读笔记59]TextBrewer(开源知识蒸馏NLP工具)
论文:TextBrewer: An Open-Source Knowledge Distillation Toolkit for Natural Language Processing哈工大,讯飞1. 简介TextBrewer是一个基于PyTorch的、为实现NLP中的知识蒸馏任务而设计的工具包, 融合并改进了NLP和CV中的多种知识蒸馏技术,提供便捷快速的知识蒸馏框架, 用于以较低的性能损失压缩神经网络模型的大小,提升模型的推理速度,减少内存占用。TextBrewer结构:流程:Sta原创 2021-09-26 12:08:15 · 952 阅读 · 0 评论 -
[论文阅读笔记57]NLP低资源的方法综述
1.题目A Survey on Recent Approaches for Natural Language Processing in Low-Resource Scenarios萨尔大学2.摘要(1)给出了当前致力于低资料NLP的广泛性与结构性概述;(2)分析低资源设置的不同方面;(3) 突出介绍必要的资源和数据假设,作为对从业者的指导;(4) 讨论开放问题与未来的展望。低资源的总体:3.相关综述生成额外标签数据Data Augmentation–使用有标注的样本信息,去扩原创 2021-08-28 07:14:09 · 1301 阅读 · 0 评论 -
[论文阅读笔记56]基于标注(NovelTagging方法)实体与关系联合抽取-ACL2017
论文:Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme1. 题目Zheng S,Wang F,Bao H,et al.Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme.ACL 2017获得了Outstanding paper2. 背景研究关系与实体加联合学习的问题;本文只考虑了一个实体属于一个三元组原创 2021-08-18 22:59:45 · 1086 阅读 · 0 评论 -
[论文阅读笔记55]弱监督在电子病历的医学研究(之二)
论文都出自 Stanford University的 ,作者与[论文阅读笔记50]弱监督在电子病历的医学研究(之一)相同;论文2-(Nature):Ontology-driven weak supervision for clinical entity classification in electronic health records题目参考:Fries, J.A., Steinberg, E., Khattar, S. et al. Ontology-driven weak supervisio原创 2021-08-13 19:06:16 · 230 阅读 · 1 评论 -
[论文阅读笔记54]面向实体对齐的多视图知识图谱嵌入方法
1. 题目Multi-view Knowledge Graph Embedding for Entity Alignment面向实体对齐的多视图知识图谱嵌入方法论文:https://arxiv.org/pdf/1906.02390.pdf代码:https://github.com/nju-websoft/MultiKE2. 研究背景研究的问题:知识图(KGs)之间基于嵌入的实体对齐问题;目前存在问题:以前的方法主要是在实体关系结构上,后面也有把属性加入作为特征,可是也有大量的实体特征未被去原创 2021-08-13 19:05:33 · 1484 阅读 · 0 评论 -
[论文阅读笔记52]深度学习实体关系抽取研究综述
来源:软件学报 20191.摘要:围绕有监督和远程监督两个领域,系统总结了近几年来中外学者基于深度学习的实体关系抽取研究进展,并对未来可能的研究方向进行了探讨和展望.2.经典的实体关系抽取方法有监督[基于特征和基于核函数的方法,研究词汇、句法和语义特征对实体语义关系抽取的影响]、半监督、弱监督和无监督3.定义实体关系抽取:是指在实体识别的基础上,从非结构化文本中抽取出预先定义的实体关系.—这里研究的时关系抽取,不讨论实体抽取.“实体关系抽取”这里不理解为“实体抽取与关系抽取”。基于深度学习原创 2021-08-10 21:46:22 · 1531 阅读 · 0 评论 -
[论文阅读笔记51]关系抽取【DNN】综述(监督与远程监督)
题目Deep Neural Network Based Relation Extraction: An Overview单位:University of Electronic Science and Technology of China内容1. 框架分为四个部分:数据集,句子表示,特征抽取,分类器这个框架是比加传统的关系抽取方法了。2. 相关概念Neural Networks:Convolutional Neural Networks (CNNs),Recurrent Neural Ne原创 2021-08-04 18:41:10 · 1305 阅读 · 0 评论 -
[论文阅读笔记50]弱监督在电子病历的医学研究(之一)
两篇论文都出自 Stanford University的 ,作者相同;论文1-(Nature):Medical device surveillance with electronic health records题目使用电子医疗记录去监控医疗设备https://www.nature.com/articles/s41746-019-0168-z.pdfhttps://github.com/som-shahlab/ehr-rweCallahan A , Fries J A , C Ré, et al原创 2021-08-03 17:45:20 · 201 阅读 · 0 评论 -
[论文阅读笔记49]UmlsBERT
题目UmlsBERT: Clinical Domain Knowledge Augmentation of Contextual Embeddings Using the Unified Medical Language System Metathesaurus == 2020==滑铁卢大学使用UMLS的Metathesaurus进行上下文embedding的临床领域知识的增强研究的问题对于类似BioBert,Bio_ClinicalBERT这些预训练模型没有加入结构化专家数据;使用UMLS机原创 2021-07-20 22:41:03 · 407 阅读 · 1 评论 -
[论文阅读笔记48]BLURB
一,题目Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing作者:YU GU, ROBERT TINN, HAO CHENG, MICHAEL LUCAS, NAOTO USUYAMA, XIAODONG LIU, TRISTAN NAUMANN, JIANFENG GAO, HOIFUNG POON机构:Microsoft Research年份:2021二,研究背景三,主要内容原创 2021-07-20 09:44:53 · 631 阅读 · 0 评论 -
[论文阅读笔记47]ZEN-BERT-based Chinese (Z) text encoder Enhanced by N-gram representations
题目ZEN: Pre-training Chinese Text Encoder Enhanced by N-gram Representations作者:Shizhe Diao, Jiaxin Bai, Yan Song, Tong Zhang, Yonggang Wang机构:创新工厂,香港科技大学年份:2019研究的问题:关注预训练字符编码问题。对句子的细粒度例如词,子词,字符等相关的细片边界问题研究,中文的这个特点特别明显,中文的词或词组都是没边界标准的。文章通过引用N-gram来处理原创 2021-07-15 23:18:42 · 843 阅读 · 2 评论 -
[论文阅读笔记46]ACEMR语料及分词与医学概念识别
题目Exploring Word Segmentation and Medical Concept Recognition for Chinese Medical Texts中文医学文本分词与医学概念识别研究香港中文大学摘要问题:要处理电子病历,可是医学数据集缺乏。贡献:收集了电子病历 – ACEMR(有人工标注的),运行模型BiLSTM,BERT,ZEN; 还有系统:WMSeg,TwASP实验结果证明了建立一个专用医疗数据集的必要性,并表明利用额外资源的模型在这两个任务中达到最佳性能,为未来原创 2021-07-12 22:24:30 · 813 阅读 · 3 评论 -
[论文阅读笔记45]ChineseBLUE[MC-BERT]
一,题目Conceptualized Representation Learning for Chinese Biomedical Text Mining中文生物医学文本挖掘的概念化表示学习Ningyu Zhang, Qianghuai Jia, Kangping Yin, Liang Dong, Feng Gao, and Nengwei Hua. 2020. Conceptualized Representation Learning for Chinese Biomedical Text Min原创 2021-07-12 22:23:44 · 2272 阅读 · 5 评论 -
[论文阅读笔记44]Named Entity Recognition without Labelled Data:A Weak Supervision Approach
一,题目Named Entity Recognition without Labelled Data:A Weak Supervision Approach无标记数据的命名实体识别: 一种弱监督方法挪威奥斯陆大学 — 挪威二,摘要问题:在目标域没有手工标记的数据时,NER怎么进行问题?解决:提出弱监督方案;依赖于广泛的标签函数来自动注释目标域的文本,然后使用Markov模型把这些标签整合在一起,把整合后的标注送入到最终的NER模型进行识别。效果:经过两个英文数据集做实验在实体层次上有7个原创 2021-07-08 21:28:11 · 713 阅读 · 0 评论 -
[论文阅读笔记43]Hierarchical Multi-Label Classification Networks
一,题目Hierarchical Multi-Label Classification Networks层次多标签分类网络Wehrmann J , R Cerri, Barros R C . Hierarchical Multi-Label Classification Networks[C]// International Conference on Machine Learning. 2019.里奥格兰德天主大学 – 巴西圣卡洛斯联邦大学 – 巴西二,摘要主要解决层次多标原创 2021-07-07 22:20:26 · 3902 阅读 · 3 评论 -
[论文阅读笔记42]BioSyn
题目Biomedical Entity Representations with Synonym Marginalization具有同义词边缘化的生物医学实体表示Korea University (韩国)高丽大学代码:https://github.com/dmis-lab/BioSynSung M , Jeon H , Lee J , et al. Biomedical Entity Representations with Synonym Marginalization[J]. Proc原创 2021-06-20 13:53:21 · 1153 阅读 · 0 评论 -
[论文阅读笔记41]关于医学的bert专题
论文1:BioBert论文题目:BioBERT: a pre-trained biomedical language representation model for biomedical text mining论文地址:https://arxiv.org/abs/1901.08746项目地址:https://github.com/naver/biobert-pretrained论文概要:Korea University, 以通用领域预训练bert为初始权重,基于Pubmed上大量医疗领域英文..原创 2021-06-20 13:41:47 · 2983 阅读 · 0 评论 -
[论文阅读笔记40]recall与rank相结合的多视角中文过程术语标准化
题目2021 - A multi-perspective combined recall and rank framework for Chinese procedure terminology normalization解决中文术语标准化; 华东理工大学https://github.com/sxthunder/CMTNhttps://arxiv.org/pdf/2101.09101.pdf摘要提出一个关于召回和排名的组合框架.由多任务候选生成器(MTCG),关键字关注力排名器(KAR),融原创 2021-06-08 22:41:55 · 609 阅读 · 0 评论 -
[论文阅读笔记39]中文医学概念标准化(共病网络)
一,题目Chinese Medical Concept Normalization by Using Text and Comorbidity Network EmbeddingY. Zhang, X. Ma and G. Song, “Chinese Medical Concept Normalization by Using Text and Comorbidity Network Embedding,” 2018 IEEE International Conference on Data Mini原创 2021-06-08 22:38:10 · 755 阅读 · 2 评论 -
[论文阅读笔记38]基于多标准主动学习EMR实体识别方法
题目A method based on multi-standard active learning to recognize entitiesin electronic medical record一种基于多标准主动学习的电子病历实体的识别方法School of Computer Science and Technology, Donghua University, Shanghai 201620, China摘要解决人工标注数据问题;提出基于多标注主动学习来标注实体识别的方法;三个关键标准原创 2021-05-27 18:31:25 · 344 阅读 · 0 评论 -
[论文阅读笔记37]Weakly Supervised Sequence Tagging from Noisy Rules
一,题目Weakly Supervised Sequence Tagging from Noisy Rules基于噪声规则的弱监督序列标注Safranchik E , Luo S , Bach S . Weakly Supervised Sequence Tagging from Noisy Rules[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(4):5570-5578.Departme原创 2021-05-25 17:51:42 · 422 阅读 · 0 评论 -
[论文阅读笔记36]CASREL代码运行记录
《[论文阅读笔记33]CASREL:基于标注与bert的实体与关系抽取》https://blog.csdn.net/ld326/article/details/116465089总的来说,文档都还是写得很好的,按文档(readme.md)来就行,不过有点小小不同就是文件的命名,作一个补充记录。0. 关于代码结构—值得学习,十分清晰1. 关于环境按说明的关键的几个句进行,可是依赖的包还是版本不对。这个是requirement.txt, 不过还是有些警告,先不处理警告:absl-py==0.12.0原创 2021-05-23 08:01:20 · 3571 阅读 · 50 评论 -
[论文阅读笔记34]基于分解策略的实体与关系联合抽取
题目Joint Extraction of Entities and Relations Based on a Novel Decomposition StrategyChinese Academy of Sciences — 中科院Xiaomi AI Lab – 小米AI实验室Peking University – 北京大学摘要解决问题: redundant entity pairs(冗余的实体对);ignore the important inner structure (忽略了重要的内原创 2021-05-19 21:26:04 · 735 阅读 · 0 评论 -
[论文阅读笔记33]CASREL:基于标注与bert的实体与关系抽取
题目A Novel Cascade Binary Tagging Framework for Relational Triple Extraction一个关系三元组抽取的新型级联二元标记框架Jilin UniversityShenzhen Zhuiyi TechnologyUniversity of North Carolina at Chapel Hill 北卡罗来纳大学教堂山分校摘要解决问题: solving the overlapping triple problem.(解决重叠三原创 2021-05-06 22:44:11 · 4284 阅读 · 5 评论 -
[论文阅读笔记31]UER: An Open-Source Toolkit for Pre-training Models
题目UER: An Open-Source Toolkit for Pre-training Models单位:School of Information and DEKE, MOE, Renmin University of China, Beijing, ChinaTencent AI LabSchool of Electronics Engineering and Computer Science, Peking University, Beijing, ChinaZhao Z ,原创 2021-04-30 17:43:23 · 842 阅读 · 1 评论 -
[论文阅读笔记30]关于pico抽取的研究-1(4篇文献)
论文1:Extracting PICO elements from RCT abstracts using 1-2gram analysis and multitask classificationYuan X , Xiaoli L , Shilei L , et al. Extracting PICO elements from RCT abstracts using 1-2gram analysis and multitask classification[C]// the third Interna原创 2021-04-30 17:39:55 · 2885 阅读 · 1 评论 -
[论文阅读笔记18] Jointly Multiple EE via Attention-based Graph Information Aggregation
1. 论文题目Jointly Multiple Events Extraction via Attention-based Graph Information Aggregation论文来源:EMNLP 2018论文链接:https://arxiv.org/abs/1809.09078代码链接:https://github.com/lx865712528/EMNLP2018-JMEE关键词:多事件抽取,GCN,attention,句法依存结构2. 作者Xiao Liu†andZhunchen原创 2021-02-22 17:37:36 · 734 阅读 · 0 评论 -
[论文阅读笔记16]More data,relations,context ,openness:A review and outlook for relation extraction
一. 题目More data, more relations, more context and more openness: A review and outlook for relation extraction.关系抽取的回顾与展望论文:https://arxiv.org/pdf/2004.03186.pdf2020年引用:Xu Han, Tianyu Gao, Yankai Lin, Hao Peng, Yaoliang Yang, Chaojun Xiao, Zhiyuan Liu,原创 2021-02-04 17:47:05 · 868 阅读 · 0 评论 -
[论文阅读笔记15]Recognizing Complex Entity Mentions:A Review and Future Directions
一,题目Recognizing Complex Entity Mentions:A Review and Future Directions识别复杂实体mentions:回顾与未来方向Dai X . Recognizing Complex Entity Mentions: A Review and Future Directions[C]// The ACL 2018 Student Research Workshop. 2018.二,作者Xiang DaiCSIRO Data61 and Sc原创 2021-01-29 16:30:32 · 496 阅读 · 0 评论 -
[论文阅读笔记14]Nested named entity recognition revisited
一, 题目Nested Named Entity Recognition Revisited重访问的嵌套命名实体识别二, 作者Arzoo Katiyar and Claire CardieDepartment of Computer ScienceCornell University 康奈尔大学 (世界顶级私立研究型大学,2021QS世界大学排名世界第18)Ithaca, NY, 14853, USA三,摘要对RNN的创新,提出识别与检测嵌套NER的方法,从RNN中抽取出一个超图表示。原创 2021-01-28 17:26:15 · 1698 阅读 · 0 评论