- 博客(8)
- 资源 (10)
- 收藏
- 关注
原创 Watson Explorer 入门(6):开发和部署UIMA管道
内容分析工作室使用UIMA的分析文件和记录结果为一组注释。UIMA的管道是一个序列的一个或多个注释阶段,逐次运行。每个注释可以添加或修改从以前的注释阶段构建文档的更详细的分析结果。一个内容分析工作室UIMA的管道主要包括四个阶段这些代码在数据驱动的方式设计,以便用户可以提供语言和特定领域的资源为目标域自定义管道。。文档语言(Document language) 首先管道会识别要处理的文档使用那种
2017-04-28 18:44:59 783
原创 Watson Explorer 入门(5):配置内容分析工作室(Studio)
在你开发内容分析工作室UIMA的管道,你必须创建一个项目来存储相关的语言资源。您还可以配置连接到沃森资源管理器内容分析服务器,并配置源代码管理系统来管理您的内容分析工作室资源。在利用内容分析工作室开发UIMA管道之前,必须创建一个项目保存语言资源。还可以配置与Watson Explorer 内容分析服务器的连接,配置一个源控制系统管理内容分析服务器资源。进行配置之前,必须首先配置与Watson Ex
2017-04-28 16:05:08 907
原创 Watson Explorer 入门(4):内容分析工作室(Studio)使用方法
内容分析工作室是一个开发环境,用来构建和测试应用领域的的文本分析引擎。这个环境,消除了对自然语言处理或UIMA的底层技术需要专业知识。通过使用内容分析工作室,您可以开发文本分析引擎,而无需编写任何代码。您可以使用内容分析工作室进行以下任务:在字典中建立语言和特定领域术语。 开发字符规则来识别表示特定类型信息的字符的模式,如电话号码或电子邮件地址。开发分析规则来识别表示特定概念的文本模式,例如人
2017-04-28 15:32:44 1457
原创 Watson Explorer 入门(3):创建搜寻器(crawler,数据爬虫)
(许野平的 Watson Explorer 笔记)创建集合后,可以看到如下界面:我们可以看到三个面板:1-搜寻与导入;2-解析和索引;3-搜索和内容分析。本练习讨论搜寻器的创建和配置,以及如何导入数据。“搜寻器”的英文是 crawler,俗称爬虫,用于从网络、硬盘等数据源自动抓取数据。因为创建界面很直观,步骤不一一细说了,这里说一下几个需要注意的问题。数据源问题前几天在一次培训课程中,不少同学提到这
2017-04-22 13:03:37 942
原创 Watson Explorer 入门(2):创建集合(Collection)
ETL 与集合(Collection)非结构化数据分析,和传统的结构化数据分析有不少相似的地方。第一步,我们需要把原始数据导入到 Watson Explorer 中。这个步骤在传统的数据分析中称为ETL。 ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较
2017-04-21 15:18:26 1305
原创 Watson Explorer 入门(1):非结构化数据相关概念
IBM Watson Explorer 是 IBM 认知技术最核心的一款产品。认知技术的核心是非结构化数据的处理能力。所以先来讨论一下非结构化数据的相关概念。结构化、半结构化、非结构化数据在我们和计算机打交道的过程中,会遇到三种类型的数据:结构化数据、半结构化数据、非结构化数据。结构化数据:格式固定的数据。常规数据库中的大部分数据、Excel表中按照固定格式填写的数据,基本上都属于结构化数据。半
2017-04-21 11:30:32 3983
转载 华为李航:NLP 有 5 个基本问题,深度学习有4个做得很好
对于自然语言理解,有两种定义。第一种是计算机能够将所说的语言映射到计算机内部表示;另一种是基于行为的,你说了一句话,计算机做出了相应行为,就认为计算机理解了自然语言。后者的定义,更广为采用。为什么自然语言理解很难?其本质原因是语言是一种复杂的现象。自然语言有5个重要特点,使得计算机实现自然语言处理很困难:语言是不完全有规律的,规律是错综复杂的。有一定的规律,也有很多例外。因为语言是经过上万年的时间
2017-04-19 14:23:15 1859
原创 Watson Explorer 基础组件概述
Watson Explorer 阅读笔记,20171-14-8IBM Watson Explorer 有两个版本,企业版(EE)和高级版(AE)。下面介绍的模块是作为这些版本的一部分提供的。如果同一个模块出现在不同版本中的话,其功能是没有任何差别的。Watson Explorer 的基础组件由以安装模块构成:Application Builder(应用程序生成器) 简化开发360度信息浏览应用系
2017-04-08 16:38:08 1844
用ATL建立轻量级的COM对象
2010-08-04
ATL 揭秘之“对象创建”篇
2010-08-04
用ATL 建立轻量级的COM 对象
2010-08-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人