![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
呼延十
呼延
展开
-
后缀数组(Suffix Array)在字符串匹配中的应用
前言首先抛出一个问题: 给定300w字符串A, 之后给定80w字符串B, 需要求出 B中的每一个字符串, 是否是A中某一个字符串的子串. 也就是拿到80w个bool值.当然, 直观的看上去, 有一个暴力的解法, 那就是 双重循环, 再调用字符串德contains方法, 想法很美好, 现实很残酷. 如果你真的这么实现了(是的, 我做了.), 就会发现,效率低到无法接受.具体的效率测评在后文给出...原创 2020-01-01 21:27:19 · 828 阅读 · 0 评论 -
Trie树的基本原理及应用
前言理论知识[什么是 Trie 树](#什么是 trie 树)[Trie 的优劣势](#trie 的优劣势)[Trie 的应用场景](#trie 的应用场景)编码实现参考文章联系我前言在做用户 query 理解的过程中,有许多需要使用词典来"识别"的过程。在此期间,就避免不了使用 Trie 树这一数据结构。因此今天我们来深入的学习一下 Trie 树相关的理论知识,并且...原创 2019-12-17 21:54:36 · 637 阅读 · 0 评论 -
用深度学习解决NLP中的命名实体识别(NER)问题(深度学习入门项目)
前言离线训练样本数据训练数据编码模型搭建加载数据评估模型在线预测tensorflow serving 介绍模型保存格式加载模型客户端请求运行环境相关链接本文源码已经上传至 github.: https://github.com/HuBlanker/Keras-Chinese-NER本文主要理论依据论文:Bidirectional LSTM-CR...原创 2019-12-01 21:42:54 · 2515 阅读 · 0 评论 -
使用FastText构建你的第一个文本分类器!
前言简介原理实际应用下载安装处理数据训练调优demo相关文章前言最近在做一些意图识别方面的工作,所以尝试一下用 fasttext 做一个文本分类器,学习记录如下。简介首先,我们使用 fasttext 的目的是什么?是文本分类,即对一个词语,给出它所属于的类别。文本分类的目标是将文档(如电子邮件,博文,短信,产品评论等)分为一个或多个类别。 这些类别可以是根据评论分...原创 2019-11-21 11:01:54 · 615 阅读 · 0 评论