自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (9)
  • 收藏
  • 关注

转载 【比赛分享】刷新CoQA榜单纪录:基于对抗训练和知识蒸馏的机器阅读理解方案解析

本文首发于机器之心微信公众号,专栏留存。近日,在由斯坦福大学发起的对话式问答挑战赛 CoQA (Conversational Question Answering Challenge)中,追一科技AI Lab团队超越微软团队成为榜单第一[1],刷新了之前微软等团队创造的CoQA纪录。值得注意的是,团队提交的技术方案中,单模型的各项指标表现首次全面超越人类。CoQA Leaderboard一直以来,机器阅读理解都是自然语言处理界最受关注、进步最快的技术方向之一,主要有两大比赛较受瞩目,分别

2020-09-30 09:33:12 511

转载 ###haohaohao####揭秘认知图谱!从多跳阅读理解问答开始

【ACL 2019】揭秘认知图谱!从多跳阅读理解问答开始Phoenix Cat劝退人工智能新天坑“机器的阅读理解与问答”一直以来被认为是“自然语言理解(NLU)”的核心问题之一,随着BERT等模型的兴起,单段落的简单阅读理解任务取得了重大突破;研究者将目光转向更能体现机器智能的“多跳”“复杂”情形。本篇论文介绍了基于认知中“双过程理论(dual process theory)”的CogQA模型,文章提出一种新颖的迭代框架:算法模拟认知学中人类的两个认知系统,并维护一张认知图谱(Cogni..

2020-09-27 15:18:55 483

转载 论文笔记--Multi-Passage Machine Reading Comprehension with Cross-Passage Answer Verification (V-Net)

First published on indexfziq.github.io at 2019-03-08 14:00:00Introduction本文出自Baidu NLP Research,在MS MARCO的V1版本上是第二;V2版本上QA任务是第三,well-formed任务是第二。代码没公开,基本的思想就是提出两个辅助任务,辅助抽取更好的答案片段。Motivation这篇文章的动机很直接,文章对数据进行分析,提出一种假设:正确的答案往往在10个摘要中出现频率高,且具有很大的相似性;然

2020-09-25 09:03:21 326

转载 【图机器学习】4篇 Graph Embedding 重要论文

第一篇:Deep WalkDeepWalk: Online Learning of Social Representations(2014,Bryan Perozzi)算法做什么的?输入:一个 graph 输出:每个节点对应的向量算法优点信息缺失下表现良好 数据稀疏的情况下表现良好 可用于大规模计算(算法可以并行化)social representations我们想让 social representations 有这样的特点Adaptability:真实世..

2020-09-14 16:47:44 571

转载 机器阅读理解(MRC)和问答(QA)在信息抽取中的应用

一 机器阅读理解(MRC)、问答系统(QA)与信息抽取最近实体关系抽取任务和命名实体识别任务的SOTA模型排行榜中,有很多模型使用到了机器阅读理解(MRC)和问答系统(QA)中思想和方法,如HBT、ETL-span、Multi-turn QA和BERT_MRC等,MRC和QA中的思想和方法的使用,让这些模型相比于传统方法有很大提升。在实体关系抽取任务中,最新的一些模型,如HBT和ETL-span,用到了MRC中经常使用的指针网络方法,通过多层标注序列解决实体重叠问题;Multi-turn QA则使用

2020-09-11 14:24:51 5401

转载 机器学习-社区发现算法介绍(一):Infomap

在诸多互联网金融风控的场景里,团伙识别是相当重要的一项工作。如果恶意攻击者以团伙的方式尝试获取利益,比如骗贷、骗保、薅羊毛,通常都会给对应的公司带来不小的经济损失。团伙识别有各种各样的方法,其中最主要的方法就是“社区发现”(community detection)类算法,常规的方法有 Louvain,Label Propagation,Infomap 等等。算法核心思想社区发现类算法似乎并不存在一个最好的算法,因为在现实数据中对于社区或者说团伙的定义千差万别,不一定都跟算法的假设匹配。有一些学术文章

2020-09-10 09:02:17 4874 1

转载 知识蒸馏与推荐系统

「写在前面:」 这是一篇介绍 「【知识蒸馏】」 在 「【推荐系统】」领域应用的文章,算是知识蒸馏简述系列文章的延续,希望能对推荐领域的同学有所帮助。以下是本文的主要框架: A brief review KD & 推荐 Conclusion 「1. A brief review」「1-1 知识蒸馏回顾」当我们训练一个深度学习模型时,常常面临模型效果与工程性能冲突的问题。在监督学习中: 训练模型时,通常采用 「复杂模型」 或者 「Ensemble」 方

2020-09-04 17:55:47 902

转载 Multimodal Machine Learning: A Survey and Taxonomy/多模态机器学习综述

1.介绍(introduction)2.历史回顾(review)3.表示(representation)4.映射(Translation/Mapping)5.对齐(Alignment)6.融合(Fusion )7.联合学习(Co-learning)8.结论(conclusion)以下是本人每一章节整理的笔记:1.介绍(introduction)论文总体介绍了多模态的五个方向/挑战:表示(representation)、映射(Translation)、对齐(Alignm

2020-09-03 16:54:37 5118

转载 游戏服务器架构演进(完整版)

http://gad.qq.com/article/detail/32876​这是王者荣耀技术分析系列第三篇,有兴趣请持续关注我的blog和公众号。1、像《王者荣耀》一样红过2、从《王者荣耀》来聊聊游戏的帧同步3、游戏服务器的架构演进想了解更多有料的原创文章,请关注我的公众号,大码侯(ID:cool_wier)一、游戏服务器特征游戏服务器,是一个会长期运行程序,并且它还要服务于多个不定时,不定点的网络请求。所以这类服务的特点是要特别关注稳定性和性能。这类程序...

2020-09-02 19:46:24 1317

转载 基于知识图谱的问答在美团智能交互场景中的应用和演进

导读:目前为止 IT 产业经历了六次浪潮,分别为:大型机时代,小型机时代,个人电脑时代,桌面互联网时代,移动互联网时代和 AIOT 时代。在这些时代背后可以发现是人机交互方式的变化:从鼠键交互,到触控交互,再到语音智能交互,可以看到人机交互的方式在向更自然更直接化的方式演进。今天会和大家分享基于知识图谱的问答在美团智能交互场景中的应用和演进。今天的介绍会围绕下面三点展开: 智能交互背景介绍 受限场景问答应用和演进 复杂场景问答应用和演进 ——智能交互背景介绍——1...

2020-09-01 14:21:39 1695

转载 #####好好好####盘点大数据在游戏行业中的应用

伴随应用商店和社交网络的兴起,游戏市场规模空前扩大,大数据和人工智能对于游戏运营特别是延长产品寿命的积极作用越发明显。但什么样的数据有价值?如何更有效的利用数据的价值?以及人工智能具体可以将游戏行业颠覆到何种程度?都逐渐成为游戏行业共同关注的问题。那么,游戏企业可以利用大数据为自己带来些什么?大数据为游戏行业带来了哪些变革?基于玩家所产生的海量数据,我们怎样去获取玩家的具体画像、他们的特点以及预测他们未来的一些行为以服务我们的运营、发行以及研发过程中的一些系统改造?我们围绕画像展开。举个例子,.

2020-09-01 11:32:46 1236

转载 端游、手游服务端常用的架构是什么样的?

作者:韦易笑链接:https://www.zhihu.com/question/29779732/answer/45791817来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。谢邀,手游页游和端游的服务端本质上没区别,区别的是游戏类型。类型1:卡牌、跑酷等弱交互服务端卡牌跑酷类因为交互弱,玩家和玩家之间不需要实时面对面PK,打一下对方的离线数据,计算下排行榜,买卖下道具即可,所以实现往往使用简单的 HTTP服务器:登录时可以使用非对称加密(RSA,.

2020-09-01 10:34:55 2855 1

转载 pdfplumber是怎么做表格抽取的(一)

pdfplumber是怎么做表格抽取的(一)冰焰虫子兴趣广泛,包含但不限于:coding,NLP,CV,深度学习笔者把自己这篇原本发布在github page上的文章迁移到了这里,原github page网址:https://iceflameworm.github.io/2019/12/02/pdfplumber-table-extraction-1/pdfplumber是一款完全用python开发的pdf解析库,对于线框完全的表格,pdfminer能给出比较好的抽取效果,但是对于线..

2020-09-01 09:56:23 1859

知网Hownet情感词典.zip

该资料包含知网情感相关的词典,分为中英文单词表,每种都梳理完毕,并整理成单独文件,非常方便,有需要的话,请下载使用。

2020-05-09

mnist.pkl.gz数据文件

mnist.pkl.gz数据文件直接下载拷贝到keras的dataset下方便许多

2017-01-10

近红外猕猴桃测试分类数据

仅供分类算法测试用数据.数据内容为相隔两天的软的猕猴桃的近红外测试数据,标签为-1 和1,可以作为一个不同时间的猕猴桃的分类数据

2016-10-24

ROC曲线 源代码包

非常齐全的各类函数包,想画什么样的ROC曲线,都有相应代码,可以自己学习,也可以二次开发进行定制。

2015-10-13

基于tiny210的SD卡MP3播放器系统代码

一个小小的例程,如题所述,可以完美运行,需要的同学下下来学习下~

2015-07-17

机器学习实战源代码

这是机器学习实战,树上的全部例子代码,需要的同学可以下下来看看,帮助学习。

2015-07-17

基于FPGA的视频图像采集系统的设计与实现

基于FPGA的视频图像采集系统的设计与实现,提出了可行的基于FPGA的采集系统的设计和实现方法。

2013-05-06

多人物识别

为多人物检测提出了一种研究方法,提出了算法设计等

2013-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除