- 博客(5)
- 收藏
- 关注
原创 CRNN实现文本的识别测试
、自然场景文本提取是图像语义信息抽取的一个重要分支,它的实现需要CV和NLP技术,即既需要使用视觉处理技术来提取图像中文字区域的图像特征向量,又需要借助自然语言处理技术来解码图像特征向量为文字结果。文本提取与识别技术是有着广泛的应用场景。已经被互联网公司落地的相关应用涉及了识别名片、识别菜单、识别快递单、识别身份证、识别营业证、识别银行卡、识别车牌、识别路牌、识别商品包装袋、识别会议白板、识别...
2019-02-25 20:29:13 2628
原创 基于gpt-2模型(117M预训练模型)的文本自动生成测试
openai的gpt-2模型最近在风口浪尖上。Language Models are Unsupervised Multitask Learners论文已经出来,但是由于该模型没有将训练过程开源出来,所以本博客仅仅是针对已经公布的117M的预训练模型进行测试。1、论文贡献In this paper, we connect these two lines of work and contin...
2019-02-22 17:27:22 9710 2
原创 具有泛化能力的句子表征模型:Gensen评测实验
Learning General Purpose Distributed Sentence Representations via Large Scale Multi-task Learning(https://arxiv.org/abs/1804.00079)一文发表在 ICLR 2018,中,该论文提出的模型能够在各种各样的任务中泛化句子表征,且设计了一个一对多的多任务学习框架。其主要贡献的描...
2019-02-21 08:25:23 986
原创 从监督数据中学习句子表示的方法InferSent评测实验
如何利用一些现成的句子语料来完成句子的嵌入表示,并支撑一些上层应用,是词嵌入技术在句子层面的一种拓展应用。2017 年 Facebook 的研究人员 Conneau 等人提出的 InferSent 框架,它的基本思想:(1)先设计一个模型在斯坦福的 SNLI(Stanford Natural Language Inference)数据集上训练,SNLI包含570K个人类产生的句子对,每个句...
2019-02-20 11:48:45 784 1
原创 句子向量的统一评测工具(senteval)实验
现有句子嵌入表示是完成句子分类、句子相似性度量及一些高级任务的基础,那么句子嵌入表示效果如何评估,是一个相对重要的度量问题。facebook研究员提出了一个句子向量的统一评测工具:senteval(https://github.com/facebookresearch/SentEval),该工具可以对当前多种主流的句子嵌入表示模型进行评测,主要包括:SkipThought with Lay...
2019-02-20 11:19:01 3246
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人