自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 【论文笔记】Question-driven summarization of answer to consumer health questions

文章目录Abstract一、Background &Summary二、Methods1.Data creation2.Evaluation metrics3. Data Records4. Experimental benchmarkingAbstract 自然语言中的自动文本摘要属于计算机科学中被广泛研究的应用。主要应用到一些需要理解大量信息的背景中。而在医学领域,自动文本摘要可以帮助一些没有医学背景知识的人更好的获得健康的医疗知识。通常情况下呢,为了评价一个摘要算法所生成摘要的质量下,

2021-04-24 21:21:10 255

原创 Question Answering Text Summarization Datasets汇总

Text Summarization Datasets目前对于自动文本摘要这一块,研究多数采用的是news articles的数据:DUC, Gigaword, New York Times, CNN/Daily Mail等。本文主要介绍一些关于Non-factoid QA或更加抽象的数据集。WikiHow:介绍:2018年由Koupaee等人提出来的一个从wikihow网站抓取的数据集。详细的了解请参照原始论文; 该数据的github.数据结构如下表:dataset sta

2021-04-23 15:58:21 526

原创 【论文笔记】Get To The Point: Summarization with Pointer-Generator Networks

题目:Get To The Point:Summarization with Pointer-Generator Networks 论文地址文章目录Abstract1 Introduction2 Our Models2.1 Sequence-to-sequence attentional model2.2 Pointer-generator network2.3 Coverage mechanismAbstract 神经Seq-seq模型为abstractive文本摘要提供了一种可行的新方法(

2020-10-17 18:56:45 502

原创 Python自动文本摘要Rouge-N的实现

本文只适用于简单的使用Rouge-1, Rouge-2,Rouge-L这三个评价体系1.使用pip进行安装rouge2.计算Rouge的值关于理论部分,可以参考这篇博客,写的很详细。1.使用pip进行安装rouge$ pip install rouge2.计算Rouge的值def rouge(a,b): rouge = Rouge() rouge_score = rouge.get_scores(a,b, avg=True) # a和b里面包含多个句子的时候用 rou

2020-10-11 18:11:49 2085 5

原创 【论文笔记】Bridging Hierarchical and Sequential Context Modeling

论文目录Abstract1. Introduction2. Method2.1 Word-level compare-Aggregate2.2 Sentence-level compare-Aggregate2.3 Question-aware Sequential Extractor3. Experiment3.2 Experimental Results3.3 Analusis3.3.1 Ablation Study4. Conclusions二、使用步骤1.引入库2.读入数据总结论文题目:Br.

2020-10-10 17:24:14 1932

原创 【论文笔记】A COMPARE-AGGREGATE MODEL FOR MATCHING TEXT SEQUENCES

论文目录AbstractIntroductionMethodExperimentsAbstract许多NLP任务,包括机器阅读理解、答案选择和文本涵义都需要进行序列之间的比较,寻找序列间的重要元素是解决这些问题的关键。在本文中,提出来一种较为通用的compare-aggregate框架,该框架先进行词级别的匹配,然后使用CNN进行聚合。主要用两种不同的比较函数去匹配两个向量。使用四种不同的数据集进行评价模型的性能。发现一些基于元素运算的简单比较函数(simple comparison functions

2020-09-29 14:45:38 833 1

原创 Joint Learning of Answer Selection and Answer Summary Generation in Community Question Answering论文笔记

论文目录abstract一、Introduction二、Related Work1.CQA2.文本摘要3.多任务学习三、Method1.问题描述2.模型四、Datasets and Experimental Setting五、Experimental Result**Answer Selection Result****Answer Summary Generation Result****Resource-poor CQA Results**六、Conclusionabstract目前,社区问答(

2020-09-26 20:43:22 640 3

原创 python使用Elasticsearch对wikipedia的数据进行检索(详细流程)

1 先下载wikipediawikepedia下载链接2 利用wikiextractor将其提取出来$git clone https://github.com/attardi/wikiextractor$python wikiextractor/WikiExtractor.py INPUT_FILE -o OUTPUT_PATH --json3 将wikidedia的数据进行清洗,具体做法如下首先用下面的代码去除doc和空格,只保留文本def deal_enwiki(read_path,

2020-09-23 21:40:39 944

原创 谈一谈对transformer的理解(代码)

关于transformer的原理,这里就不多说,主要还是结合论文中的图来对代码进行一下讲解。看这张图,其实可以看到最核心的部分就是下面这一块:关于讲解,我就直接写在代码里面,用中文来对其进行详细的一个介绍。相对应的代码如下:class ScaledDotProductAttention(nn.Module): ''' Scaled Dot-Product Attention ''' def __init__(self, temperature, attn_dro.

2020-09-23 20:56:31 514

原创 Example object is not iterable

用torchtext的时候,建立vocab,出现错误:错误原因:调用的对象出现错误。应该调用的是example数据类型的对象

2020-05-25 10:41:03 376

原创 index out of range: Tried to access index 514 out of table with 513 rows.

错误:源码:将roberta作为特征提取器:将max_length改成512

2020-05-22 16:32:21 832 1

转载 请放下你的无效社交

原文出处: 李笑来   欢迎分享原创到伯乐头条有一次在北大讲座,遇到一位学生问我,“老师,你说学习重要,还是经营人脉重要?”看着他一脸大杂烩的表情,我先拿出本子记下了这个问题,然后告诉他说,这是个比较大的话题,我会仔细写篇文章放在网上的,然后给了他我的博客地址。而后又补了一句,“相信我,所谓的人脉就算重要,也根本没他们说的那么重要”。你愿意与什么样的人成为朋友?让我们细说从头。先动脑思

2017-12-18 14:56:42 462

转载 Eclipse中所有快捷键

Eclipse中的所有快捷键列表:Ctrl+1 快速修复(最经典的快捷键,就不用多说了) Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加) Ctrl+Alt+↑ 复制当前行到上一行(复制增加) Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了) Alt+↑ 当前行和上面一行交互位置(同上) Alt+← 前一个编辑的页面 Alt+→

2017-04-04 11:31:12 688

翻译 计算机专外Week6-Exercises

Week 6 > Analog and Digital 2 Exercises > VerticalQ1: Which one of the following best describes digitization of sound? Convert the sound signal into a series of numbers representing the signal’s diff

2017-04-03 16:29:30 5372

翻译 计算机专外Week5-Exercises

Week 5 > Table startsWith endsWith Exercises > ProblemsQ1: Write code to print all the rows where the name starts with “X”.table = new SimpleTable("baby-2010.csv");for (row: table) { // your code he

2017-04-03 16:17:00 6789

翻译 计算机专外Week4-Exercises

Week 4 > Software 1 Exercises > ProblemsQ1: The CPU in the computer directly “runs” a sequence of what type of instruction? Java Code Machine Code - correct C++ Code Javascript Code

2017-04-03 16:07:18 6548 1

翻译 计算机专外Week3_Exercises

Week 3 > Image Logic Exercises > ProblemsQ1: Here is the fence-ivy.jpg image: Write code that picks out the pixels of the green leaves in the image (using the > avg * factor technique, as in lecture)

2017-04-03 15:51:08 8653

翻译 计算机专外Week2-Exercises

Week 2 > Image For-Loop Exercises > Vertical2Q1: Add code inside the loop to modify flowers.jpg like this: set each pixel to have green of 0, leaving the red and blue values unchanged. The result shoul

2017-04-03 15:36:23 7961

翻译 计算机专外-Week1 exercises

Week 1 > Code Writing Exercises > ProblemsQ1: Change the “print” code below so it produces the following output when run: 1 2 helloprint(1, 2,"hello");Q2: Change the “print” code below so it produces

2017-04-03 15:17:26 3529

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除