- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 tf-idf
TF-IDF 是为了解决 document 中 term 的权重问题。TF (term frequency)将一个 document 中的每一个 term 都赋予一个权重,最简单的方法就是将 term 在此 document 中出现的次数。用频数表示权重的方法叫做 TF,数学表示为:tft,d\text{tf}_{t,d} ,表示 “document” d 中 “term” t 出现的次数。I
2018-02-20 17:40:28 609
翻译 使用 spacy 进行自然语言处理(一)
介绍自然语言处理(NLP) 是人工智能方向一个非常重要的研究领域。 自然语言处理在很多智能应用中扮演着非常重要的角色,例如:automated chat bots,article summarizers,multi-lingual translationopinion identification from data每一个利用NLP来理解非结构化文本数据的行业,不仅要求准确,而且在获取结果
2018-02-13 13:09:42 71379 8
原创 pytorch学习笔记(十九):torchtext
文章部分翻译自 http://anie.me/On-Torchtext/ API一览torchtext.datatorchtext.data.Example : 用来表示一个样本,数据+标签torchtext.vocab.Vocab: 词汇表相关torchtext.data.Datasets: 数据集类,__getitem__ 返回 Example实例torchtext...
2018-02-11 13:47:04 51616 31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人