自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 NLP学习笔记 02 句法和文法

目录2.1 依存句法分析2.2 语义依存分析2.1 依存句法分析依存语法 (Dependency Parsing, DP) 通过分析语言单位内成分之间的依存关系揭示其句法结构。 直观来讲,依存句法分析识别句子中的“主谓宾”、“定状补”这些语法成分,并分析各成分之间的关系。例子:哈工大语言技术平台Language Technology Platform(LTP)中依存句法分析标注关系 (...

2018-12-21 16:12:40 773 1

原创 NLP学习笔记 01 分词、词性标注和关键词提取

1.1 准确分词part1提高分词准确性:加载自定义词典使用正则表达式在hanlp中加入自定义词典,首先在/ hanlp / data / dictionary / custom / 目录下,创建词典(txt格式),每一行代表一个单词,格式遵从[单词] [词性A] [A的频次] [词性B] [B的频次] ... 如果不填词性则表示采用词典的默认词性。在统计分词中,并不保证自定义词典中...

2018-12-17 17:27:31 3097 1

原创 NLP自然语言处理常用的Python库 及安装方法

1、NLTKNatural Language Toolkit,自然语言处理工具包,在NLP领域中,最常使用的一个Python库。安装:pip install nltk2、Gensim可以用来从文档中自劢提取语义主题。它包含了很多非监督学习算法如:TF/IDF,潜在语义分析(Latent Semantic Analysis,LSA)、隐含狄利克雷分配(Latent Dirichlet All...

2018-12-14 14:59:31 19667 1

原创 Docker 简介和安装

Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从Apache2.0协议开源。Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口(类似 iPhone 的 app),更重要的是容器性能开销极低。Windows 7 / 8:https://docs...

2018-12-11 16:56:11 179

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除