自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 收藏
  • 关注

转载 NLP入门概览(9) ——句法分析c:局部句法分析、依存关系分析

  在上一部分中,我们介绍了基于规则法、概率统计法、神经网络法的完全句法分析方法(NLP入门概览(8)——句法分析b:完全句法分析)。  在这一部分中,我们将介绍句法分析中的另外两种类型:局部句法分析、依存关系分析。1.局部句法分析  相比于完全句法分析要求对整个句子构建句法分析树,局部句法分析(浅层句法分析、语块分析)仅要求识别句子中某些结构相对简单的独立成分,如非递归的名词短语、动词短语等。这些识别出来的结构通常被称作语块(chunk),语块和短语这两个概念可以换用。  例如:  由此可见,

2020-10-21 14:36:39 3925

转载 NLP入门概览(8) ——句法分析b:完全句法分析

  在上一部分中,我们简单介绍了完全句法分析的概念,并详细介绍了句法分析的基础:Chomsky形式文法(NLP入门概览(7) ——句法分析a:Chomsky(乔姆斯基)形式文法)。  在这一部分中,我们将对完全句法分析进行详细介绍。  回顾一下,句法分析共有三种类型:完全句法分析、局部句法分析、依存关系分析。  对于完全句法分析,还是NLP领域中常用的三种解决方法:规则法、概率统计法、神经网络方法。  下面我们从这三个方法入手,对完全句法分析算法进行介绍。1.规则句法分析算法  从上述句法分析树

2020-10-21 11:43:55 3330

转载 NLP入门概览(7) ——句法分析a:Chomsky(乔姆斯基)形式文法

  在上一部分中,我们介绍了NLP领域最基本的问题:词法分析,现阶段解决该问题最常用的方法就是将其转化为序列标注问题,根据解决序列标注问题的方法对其进行解决。  词的问题解决了,那么下一步,就是句法分析。  在这一部分中,我们介绍完全句法分析的基础——Chomsky形式文法。  句法分析的任务是确定句子的句法结构或句子中词汇之间的依存关系,主要包括三种:完全句法分析、局部句法分析、依存关系分析。  其中,前两种句法分析是对句子的句法结构进行分析(也称为短语结构分析),而后一种是对句子中词汇间的依存关

2020-10-21 11:07:48 6052

原创 知识图谱体系梳理

好久没有时间写东西了,有一些调整吧,借着档期,梳理下相关体系,定期把体系整理成系列与大家分享

2020-09-09 10:41:08 8668

原创 Docker系列(8) Docker网络(3)-- 单机Docker网络配置

1. 默认网络当你安装了docker,自动创建了3个网络,可以使用docker network命令来查看dd@ubuntu04:~$ docker network lsNETWORK ID NAME DRIVER SCOPE61848f3f9e62 bridge bridge ...

2020-05-08 00:21:39 17012

原创 Docker系列(8) Docker网络(2)-- Docker四种网络模式简介

本篇介绍Docker单机网络的四种模式Docker网络模式配置说明host模式–net=host容器和宿主机共享Network namespacecontainer模式–net=container:NAME_or_ID容器和宿主机共享Network namespacenone模式–net=none容器有独立的Network namespace,但并没...

2020-05-07 18:42:01 14988

原创 Docker系列(8) Docker网络(1)-- 网络技术基础

为了更好的理解Docker网络,对相关网络技术基础,做一个简单总结,内容来自《Linux虚拟网络技术》、《Linux中的虚拟网络》和《Kubernetes权威指南:从Docker到Kubernetes实践全接触(第4版)》。理解本节内容对于后面理解docker网络和k8s网络都有不少帮助1. Network NamespaceNetwork Namespace 是 Linux 内核提供的功能,...

2020-05-07 18:24:42 15244

原创 知识图谱系列

记性也越来越差了,基本上如果完全不用,不到两周,基本一干二净了,为了摆脱这个现状,最近准备推进知识体系的梳理一直很喜欢做知识图谱相关工作,但也断档了好久了。 最近这个周期暂停了知识图谱工作,一是因为团队管理事情比较多(大几十人的团队),二是周期重点工作在大数据机器学习平台上线(安利下,虽然已经不在老东家,但是dd出品,必属精品,6.15正式上线后,机器学习平台栏计划同步更新,也算为老东家引流,...

2020-05-07 10:59:21 14924

原创 K8系列

记性也越来越差了,基本上如果完全不用,不到两周,基本一干二净了,为了摆脱这个现状,最近准备推进知识体系的梳理K8s断断续续使用过(因为老东家更多的是粗狂式物理机模式,实操不是很多),但一直没有整理过,学了忘,用了忘,忘了学,借着这次机会完成相关记录,供参考K8s系列(1) K8s基础概念K8s系列(2) k8s安装K8s系列(3) K8s使用配置K8s系列(4)K8s基本命令K8s...

2020-05-07 10:48:51 16931

原创 Docker系列(7) Web 应用案例

1 运行一个 web 应用前面我们运行的容器并没有一些什么特别的用处。接下来让我们尝试使用 docker 构建一个 web 应用程序。我们将在docker容器中运行一个 Python Flask 应用来运行一个web应用。dd@ubuntu04:~$ docker pull training/webappdd@ubuntu04:~$ docker run -d -P training/...

2020-05-07 10:35:23 15264

原创 Docker系列(6) Docker镜像使用

当运行容器时,使用的镜像如果在本地中不存在,docker 就会自动从 docker 镜像仓库中下载,默认是从 Docker Hub 公共镜像源下载。本节主要包括:1、管理和使用本地 Docker 主机镜像2、创建镜像1. 列出镜像列表我们可以使用 docker images 来列出本地主机上的镜像。dd@ubuntu04:~$ docker imagesREPOSITORY ...

2020-05-07 09:56:49 15565

原创 Docker系列(5) Docker 容器使用

1. Docker 客户端docker 客户端非常简单 ,我们可以直接输入 docker 命令来查看到 Docker 客户端的所有命令选项。dd@ubuntu04:~$ dockerUsage: docker [OPTIONS] COMMANDA self-sufficient runtime for containersOptions: --config strin...

2020-05-07 09:01:58 15111

原创 Docker系列(4) Docker 入门

1. Docker Hello World(docker run)  Docker 允许你在容器内运行应用程序, 使用 docker run 命令来在容器内运行一个应用程序。 输出Hello worlddd@ubuntu04:~$ sudo docker run ubuntu:18.04 /bin/echo "Hello world"  各个参数解析:docker: docker命令...

2020-05-06 19:48:09 14971

原创 Docker系列(2) 环境准备

1. 系统安装  采用Ubuntu18.04 系统安装Docker  安装参见 VMVare安装Ubuntu18.04  需要注意的是Docker对于操作系统版本的要求  Ubuntu 支持系统版本如下:Xenial 16.04 (LTS)Bionic 18.04 (LTS)Cosmic 18.10Disco 19.04其他更新的版本……  CentOS支持版本如下Ce...

2020-05-06 19:02:31 14971

原创 Docker系列(3) ubuntu docker安装

1. 版本介绍Docker 的旧版本被称为 docker,docker.io 或 docker-engine ,目前版本分为docker-ce(社区版),docker-ee(企业版)系统版本要求:Docker Engine-Community 支持以下的 Ubuntu 版本:Xenial 16.04 (LTS)Bionic 18.04 (LTS)Cosmic 18.10Disco ...

2020-05-06 18:33:33 14933

原创 Docker系列(1) docker介绍

1. 历史  2010年,几个搞IT的年轻人,在美国旧金山成立了一家名叫“dotCloud”的公司。  这家公司主要提供基于PaaS的云计算技术服务。具体来说,是和LXC有关的容器技术。后来,dotCloud公司将自己的容器技术进行了简化和标准化,并命名为——Docker。  Docker技术诞生之后,并没有引起行业的关注。而dotCloud公司,作为一家小型创业企业,在激烈的竞争之下,也步...

2020-05-06 16:56:46 15320

原创 Docker系列

记性也越来越差了,最近准备推进知识体系的梳理和整理Docker断断续续使用过,但一直没有整理过,这里完成相关记录,供参考Docker系列(1) docker介绍Docker系列(2) 环境准备Docker系列(3) ubuntu docker安装Docker系列(4) docker 入门Docker系列(5) docker 容器使用Docker系列(6) docker镜像使用D...

2020-05-06 15:24:31 11561

原创 VMVare 打不开磁盘xxx.vmdk

vmvare非正常关机下可能会出现如下错误:解决方法:找到存放虚拟机文件的文件夹,删掉.lck文件夹,重启即可

2020-05-06 12:13:00 14975

原创 VMVare安装Ubuntu18.04

1. 环境准备下载镜像下载ubuntu-18.04.4-live-server-amd64.isohttp://mirrors.aliyun.com/ubuntu-releases/18.04/ubuntu-18.04.4-live-server-amd64.iso配置虚拟机资源内存处理器数量处理器核数硬盘2G2120Gvmvare 选择镜像...

2020-05-06 10:38:14 15131

原创 人工智能创业盈利点在何处

  在AI创投界,仍有一个问题悬而未决:AI创业最可行的商业模式,依旧模糊不堪。  要知道,仅在中国A股市场,就有200多家大数据和人工智能企业,这还不算尚未上市的数以千计的初创企业。然而,不少投资人在抱怨,往来于各种AI论坛的光鲜中,那些科技新贵们看似群星璀璨,但真正在商业化上令人兴奋的公司数量,却非常惨淡。  前年年底,一篇《保卫科大讯飞》,更是揭开了AI团队遭遇BAT时的伤疤。文章导语写...

2020-02-25 17:52:15 12736

原创 开源七大盈利模式

  开源软件在发展历程中,已经不仅仅是开放源代码的免费软件。开源软件与商业并不冲突,它是一种新兴的商业模式。与传统的商业软件相比,开源软件采用了开放源代码、免费分发等形式,减少了营销与销售成本,更易于广泛传播。1. 概述  在开源软件领域中,常见的盈利模式一共有7种。下面让我们来逐一列举和分析。盈利模式之一:多种产品线如 MySQL 产品就同时推出面向个人和企业的两种版本,即开源版本和专...

2020-02-24 16:23:42 17108

转载 NLP入门概览(6) ——词法分析

  在上一部分中,我们介绍了NLP领域中的一个基本问题:序列标注问题,并对解决该问题的三种方法:HMM、CRF、RNN+CRF进行了介绍。在这一部分中,我们将在语言结构层面对词法分析进行介绍。  在了解了NLP架构之后,一定还记得这样一张图:  现在,我们已经了解了自然语言研究层面的基本概念:语言模型、序列标注,下一步就是对“词”的分析和处理。  还是那句话,规则法、概率统计法、深度学习...

2020-02-11 19:54:16 17635

转载 NLP入门概览(5)—— 序列标注b:条件随机场(CRF)、RNN+CRF

  了解了HMM之后,我们可以发现HMM有两个很明显的缺点:HMM定义的是联合概率,必须列举出所有可能出现的情况,这在很多领域是很困难的。在NLP领域,常知道各种各样但又不完全确定的信息,需要一个统一的模型将这些信息综合起来。HMM遵循一个假设:输出独立性假设。这要求序列数据严格相互独立才能保证推导的正确性,导致不能考虑上下文特征。而在NLP领域,上下文信息是很重要的。  因此,引入条件随...

2020-02-10 23:01:53 15545

转载 NLP入门概览(4)—— 序列标注a:隐马尔科夫模型(HMM)

  在这一部分中,我们将要介绍NLP领域最常见的一类问题:序列标注。1. 序列标注  在NLP领域中,有许多的任务可以转化为“将输入的语言序列转化为标注序列”来解决问题。比如,命名实体识别、词性标注等等。1.1 命名实体识别  命名实体识别是NLP中的一个经典问题,比如从一句话中识别出人名、地名、组织机构名等等。  举例来看:  任务目标:将给定的输入序列中的组织机构名识别出来。 ...

2020-02-06 11:41:06 15506

转载 NLP入门概览(3)—— 神经网络语言模型、词向量

  在这一部分中,我们将在此基础上介绍神经网络语言模型以及词向量的相关知识。在介绍这些知识之前,我们首先对自然语言处理领域的整体架构进行一些简单的介绍。1. 自然语言处理架构  首先,我们来看这样一张图。  从这张图中,可以清晰地看到,所谓的规则法、概率统计法、深度学习法都只是处理各类NLP问题的具体方法,而不是NLP问题的组成部分。(这一点一定要清晰,NLP不只是深度学习,深度学习仅仅是...

2020-02-05 18:30:11 15906

转载 NLP入门概览(2)——统计语言模型、语料库

1. 语言模型  在这一部分中,我们讨论的语言模型主要是统计语言模型,除此之外,我们在今后的文章中还会对神经网络语言模型进行介绍。  所谓语言模型,就是利用数学的方法描述语言规律。而统计语言模型,就是用句子S出现的概率P(S)来刻画句子的合理性(而不进行语言学分析处理),这是统计自然语言处理的基础模型。  假设句子S=w1,w2,…,wn,其中,wi可以暂时看作句子中的第i个词(在后面会进行...

2020-02-05 10:53:45 15285

转载 NLP入门概览(1)——概述

1. 什么是自然语言处理  个人认为,自然语言处理(Natural language processing,NLP)是将自然语言处理为计算机所能理解的东西,并利用计算机做一些进一步的处理以达到某些目的的方法。  那么问题来了,自然语言是什么?  自然语言,指人们平时用于交流的语言,例如英语、法语、汉语等等,也包括手语、旗语等,其标准定义为:人类社会发展过程中自然产生的、约定俗成的人类语言。...

2020-02-03 17:41:03 14937

原创 知识图谱生命周期及工具

1. 知识图谱生命周期  从行业知识图谱的全生命周期来看,可以分为知识建模,知识获取,知识融合,知识存储,知识计算和知识应用6个部分。1.1 知识建模  知识建模即建立知识图谱的模式层(也称本体层、动态本体层),行业知识图谱依托于模式层对整个知识图谱的结构进行定义,因此需要保证可靠性。  通常采用两种方法:一种是自顶向下的方法,专家手工编辑形成数据模式;另一种是自底向上的方法,基于行业现...

2020-01-13 23:52:36 17664 1

原创 通用知识图谱VS行业知识图谱

  众所周知,知识图谱是Google于2012年提出,用来优化搜索结果。经过多年的发展,知识图谱在人工智能的许多行业都拥有了成熟落地的应用。按照知识图谱的覆盖面来看,主要分为通用知识图谱与行业知识图谱。This is why a “web” of notes with links between them is far more useful than a fixed hierarchica...

2020-01-12 22:46:51 23302

原创 知识图谱研究进展

在原文《知识图谱研究进展》基础上上做了相应的调整和补充本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义。其次,介绍知识图谱构建的关键技术,包括实体关系识别技术、知识融合技术、实体链接技术和知识推理技术等。然后,给出现有开放的知识图谱数据集的介绍。最后,给出知识图谱在情报分析中的应用案例。— 漆桂林、高桓、吴天星东南大学计算机科学与工程学院本文节选自《情报工程》2017 年第 1 期...

2020-01-12 17:43:38 20288

原创 自下而上构建知识图谱全过程

**导读**:知识图谱的构建技术主要有自顶向下和自底向上两种。其中自顶向下构建是指借助百科类网站等结构化数据源,从高质量数据中提取本体和模式信息,加入到知识库里。而自底向上构建,则是借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中。在本文中,笔者主要想分享一下自底向上构建知识图谱的全过程,抛砖引玉,欢迎大家交流。“The world is not made of strings , but is made of things.”——辛格博士,from Go

2020-01-12 16:22:12 20629

原创 知己

前言  随手写写,没去理逻辑,理思路,想到哪儿,写到哪儿其实越忙的时候,越想做梳理,想把自己所学与大家交流分享,第一个想到时首先要知己基本情况  先说一下自己的基本情况吧 ,性别男,取向女,小硕,码农,长得不咋地,喜欢搞技术,多面手,伪学霸、伪全栈,各方面能力均衡,工作5年,年纪不小,心里年龄至少感觉比实际年龄要小个11岁吧,双商、口才都还在水平线上,资深路痴,性格谦和工作  工作上已经...

2020-01-12 12:40:15 14764

原创 OWL入门(1)-- 基本概念介绍

OWL入门(1)-- 基本概念介绍1. 简介2. OWL语法3. 基本概念4. 参考文献1. 简介  OWL2 Web本体语言(OWL)是一种语义Web语言,它被设计用来表示关于实体、实体间关系的丰富和复杂知识。  OWL是一个以计算逻辑为基础的语言,用OWL表示的知识可以通过计算机程序进行推理(演绎推理),从而验证知识一致性,或者使隐性知识显性化。  OWL文档,也被称为本体,能够在万维...

2020-01-12 11:35:07 20096 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除