2019年02月_sparkexpert

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月

原创 CRNN实现文本的识别测试

、自然场景文本提取是图像语义信息抽取的一个重要分支，它的实现需要CV和NLP技术，即既需要使用视觉处理技术来提取图像中文字区域的图像特征向量，又需要借助自然语言处理技术来解码图像特征向量为文字结果。文本提取与识别技术是有着广泛的应用场景。已经被互联网公司落地的相关应用涉及了识别名片、识别菜单、识别快递单、识别身份证、识别营业证、识别银行卡、识别车牌、识别路牌、识别商品包装袋、识别会议白板、识别...

2019-02-25 20:29:13 2628

原创基于gpt-2模型（117M预训练模型）的文本自动生成测试

openai的gpt-2模型最近在风口浪尖上。Language Models are Unsupervised Multitask Learners论文已经出来，但是由于该模型没有将训练过程开源出来，所以本博客仅仅是针对已经公布的117M的预训练模型进行测试。1、论文贡献In this paper, we connect these two lines of work and contin...

2019-02-22 17:27:22 9710 2

原创具有泛化能力的句子表征模型：Gensen评测实验

Learning General Purpose Distributed Sentence Representations via Large Scale Multi-task Learning（https://arxiv.org/abs/1804.00079）一文发表在 ICLR 2018，中，该论文提出的模型能够在各种各样的任务中泛化句子表征，且设计了一个一对多的多任务学习框架。其主要贡献的描...

2019-02-21 08:25:23 986

原创从监督数据中学习句子表示的方法InferSent评测实验

如何利用一些现成的句子语料来完成句子的嵌入表示，并支撑一些上层应用，是词嵌入技术在句子层面的一种拓展应用。2017 年 Facebook 的研究人员 Conneau 等人提出的 InferSent 框架，它的基本思想：（1）先设计一个模型在斯坦福的 SNLI（Stanford Natural Language Inference）数据集上训练，SNLI包含570K个人类产生的句子对，每个句...

2019-02-20 11:48:45 784 1

原创句子向量的统一评测工具（senteval）实验

现有句子嵌入表示是完成句子分类、句子相似性度量及一些高级任务的基础，那么句子嵌入表示效果如何评估，是一个相对重要的度量问题。facebook研究员提出了一个句子向量的统一评测工具：senteval（https://github.com/facebookresearch/SentEval)，该工具可以对当前多种主流的句子嵌入表示模型进行评测，主要包括：SkipThought with Lay...

2019-02-20 11:19:01 3246

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 CRNN实现文本的识别测试

原创 基于gpt-2模型（117M预训练模型）的文本自动生成测试

原创 具有泛化能力的句子表征模型：Gensen评测实验

原创 从监督数据中学习句子表示的方法InferSent评测实验

原创 句子向量的统一评测工具（senteval）实验

空空如也

空空如也

原创基于gpt-2模型（117M预训练模型）的文本自动生成测试

原创具有泛化能力的句子表征模型：Gensen评测实验

原创从监督数据中学习句子表示的方法InferSent评测实验

原创句子向量的统一评测工具（senteval）实验