liangwqi的博客

技无止境,空藏万有 虚怀若谷,莫争高低

Elasticsearch原理学习--为什么Elasticsearch/Lucene检索可以比MySQL快

                                                                           ...

2019-02-13 10:19:34

阅读数 11

评论数 0

文本多任务分类

文本分类是一个很普遍问题,但是往往同一个数据源有多个category需要进行分类。面对这样问题,人本能会只看一次数据,同时对两个任务做分类,那么机器学习的方法是否也可以实现“看一样做多个任务分类”任务呢。答案当然是可以,本文只负责实现没有考虑多任务分类是否效果优于多个单任务分类。 导入工具包: ...

2019-01-02 19:39:46

阅读数 12

评论数 0

Tensorflow入门教程(三十)语音识别(中)

------韦访 20181126 6、提取音频数据的MFCC特征 上一讲花了很大的篇幅来将这个MFCC特征,现在我们就来提取它。Python牛逼之处就是有非常多的工具支持各种操作,很完善,所以这里也不需要我们从头开始写,可以借助python_speech_features工具来实现。 首先...

2018-12-24 20:29:25

阅读数 53

评论数 0

如何理解 n 维空间和 n 维时空

如何理解 n 维空间和 n 维时空 前言 一定有朋友好奇为何笔者会突然发这样一篇看似和技术完全不相干的文章出来。其实这块内容也是笔者在研究时空搜索的时候引申出来的内容。看了一些资料,加深了对 n 维空间和 n 维时空的理解,就总结了一下。如果是对这方面完全没有接触的朋友一开始看一定会觉得陌...

2018-12-10 19:55:09

阅读数 142

评论数 0

高效的多维空间点索引算法 — Geohash 和 Google S2

引子 每天我们晚上加班回家,可能都会用到滴滴或者共享单车。打开 app 会看到如下的界面: app 界面上会显示出自己附近一个范围内可用的出租车或者共享单车。假设地图上会显示以自己为圆心,5公里为半径,这个范围内的车。如何实现呢?最直观的想法就是去数据库里面查表,计算并查询车距离用户小...

2018-12-10 16:34:17

阅读数 51

评论数 0

hadoop和spark超大矩阵点乘思路在多源数据POI融合中应用

最近碰到一个奇葩需求,需要通过各种特征做多数据源poi数据融合。说白了就是要把各家图商以及网路上扒下来数据合成到一张表里,去掉冗余数据,增加各图商特性数据。这个问题乍看起来不难,里面其实挺大坑。首先,需要找到一个在个数据源都可行的唯一ID,作为数据挂接的唯一标识,然而这样的标识是不存在的。解决思路...

2018-12-05 20:33:27

阅读数 48

评论数 0

Linux性能优化

随着应用负载的增加,系统资源的使用也会升高,甚至达到极限。而性能问题的本质,就是系统资源已经达到瓶颈,但请求的处理却还不够快,无法支撑更多的请求。 性能分析,其实就是找出应用或系统的瓶颈,并设法去避免或者缓解它们,从而更高效地利用系统资源处理更多的请求。这包含了一系列的步骤,比如下面这六个步骤。...

2018-11-30 17:10:57

阅读数 28

评论数 0

“变形金刚”为何强大:从模型到代码全面解析Google Tensor2Tensor系统

  张金超_WXG_PRC   在这篇文章中: 第一章:概述 第二章:序列到序列任务与Transformer模型 2.1 序列到序列任务与Encoder-Decoder框架 2.2 神经网络模型与语言距离依赖现象 2.3 self-attention机制的形式化表达 2.4...

2018-11-28 15:00:08

阅读数 58

评论数 0

从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史

目录   图像领域的预训练 Word Embedding考古史 从Word Embedding到ELMO 从Word Embedding到GPT Bert的诞生         Bert最近很火,应该是最近最火爆的AI进展,网上的评价很高,那么Bert值得这么高的评价吗?我个...

2018-11-27 19:50:40

阅读数 113

评论数 0

深度学习中注意力机制

Attention机制的本质思想 如果把Attention机制从上文讲述例子中的Encoder-Decoder框架中剥离,并进一步做抽象,可以更容易看懂Attention机制的本质思想。                                                   ...

2018-11-27 19:26:51

阅读数 89

评论数 0

知识问答

目录  知识问答概述和相关数据集 问答系统历史 答题机器人 测评数据集  多语种问答 QALD的评测指标  WebQuestions  Free917  KBQA基本概念及挑战 知识问答简单流程和分类 ​ 基于符号表示(传统)的知识库问答 ​ 基于分布式表示(DL...

2018-09-17 18:19:48

阅读数 336

评论数 0

使用elasticsearch搭建实体搜索引擎

文章摘致:http://openkg.cn/tool/elasticsearch-kbqa 本文档简述基于elasticsearch搭建一个简易实体搜索引擎的流程。该搜索引擎可以按照名称检索实体,实体 属性,多跳检索,以及检索符合多对属性要求的实体。在功能逻辑完成后,可搭建网站将其可视化,一个...

2018-09-14 22:03:49

阅读数 187

评论数 0

语义搜索

语义搜索简介 目录 语义搜索简介 文档检索 vs. 数据检索 语义模型 语义数据搜索 语义Web——数据Web 利用链接数据进行搜索 存储和索引 (Semplore) 排序原则 如何将排序紧密结合到基本操作中? ​ 从DBpedia收集的混合的查询数据集 为图结构数据...

2018-09-14 21:53:38

阅读数 320

评论数 0

知识图谱科普文

目录   1. 知识图谱的研究目标与意义 2. 知识工程的发展历程 1950-1970 时期: 1970-1990 时期: 1990-2000 时期:万维网 Web 1.0 2006 年至今:知识图谱 3. 知识图谱技术 3.1 知识图谱构建 知识表示与建模 实体识别与链接 ...

2018-09-08 09:45:37

阅读数 344

评论数 0

知识推理

目录    本体知识推理简介与任务分类 OWL本体语言 知识推理任务 OWL本体推理 ​ 实例化(materialization)的一个例子: OWL本体推理:不一致性检测 OWL本体非标准推理:计算辩解  本体推理方法与工具介绍 基于Tableaux运算的方法 ​  ...

2018-09-07 15:37:59

阅读数 691

评论数 0

知识融合

目录 知识融合简介 目标: 融合各层面的知识 合并两个知识图谱(本体) 来源于不同知识库的同一实体 实体对齐是知识融合主要工作 中文百科中等价实例 概念层知识融合 跨语言知识融合 知识在线融合 ​ 各种相关名词术语 知识融合 (Knowledge Fusion) 本体对...

2018-09-06 12:21:49

阅读数 338

评论数 0

知识图谱存储

目录 从一个例子开始 数据来源 数据描述 数据导入 数据查询 数据更新  图数据库介绍 图数据库分类  开源数据库介绍:RDF4j 、gStore等  商业数据库介绍:Virtuoso、AllegroGraph、Stardog等 Virtuoso ​ Al...

2018-09-06 10:12:54

阅读数 572

评论数 0

知识抽取(二)

目录 面向文本的知识抽取 关系抽取分类 Deepdive关系抽取实战 KBC系统 kbc系统自动搭建框架 KBC流程 框架实战:抽取上市公司中的股权交易关系 开放域关系抽取 知识挖掘 实体消歧与链接 知识规则挖掘 Stactical Schema Induction 关联...

2018-09-04 13:25:34

阅读数 420

评论数 1

知识抽取(一)

这部分知识涉及到知识图谱重要环节,知识抽取和知识链接,会涉及到很多算法和抽取pipline。需要较强的背景知识,本文仅把思路和算法做了概括并没详细展开讲解,需要了解相关算法细节可以谷歌。 目录  知识抽取任务定义和相关比赛 知识抽取技术 • 实体抽取 序列标注方法(HMM、CRF、LS...

2018-09-01 22:25:33

阅读数 913

评论数 0

知识图谱表示

目录   早期知识图谱表示 知识分类 一阶谓词逻辑 (First-Order Logic) Horn逻辑:一阶谓词逻辑的子集 描述逻辑:一阶谓词逻辑的可判定子集 产生式规则 (Production Rule) 框架 (Framework) 语义网络 (Semantic Netwo...

2018-08-31 10:47:24

阅读数 653

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭