![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
断句
ruilinch_
这个作者很懒,什么都没留下…
展开
-
YELP NLP 英文文本断句
@关于Yelp NLP Project的介绍和问题设定 STEP 1.2: SENTENCE TOKENIZATION WITH spaCy 查了一些资料之后,我决定将reviews 和 sentences 的对应关系存在postgresql数据库里,方便以后随时检索和调整。我没有用Json文件来存,是因为之前做过一个比较大的项目,用json来存,检索的时候发现速度很慢。在检索速度上,还是关系型数...原创 2019-02-18 18:05:29 · 1734 阅读 · 0 评论 -
Yelp NLP Text Classification Modeling 文本分类模型 with Prodigy
@Yelp NLP项目介绍 @文本预处理 接下来,我需要: 建立Training Set。 搭建分类模型。因为这是个练手的项目,所以我想把不同的模型都试一下。以下是我想尝试的分类模型清单: Naive Bayes Classifier Linear Classifier Support Vector Machine Boosting Models Shallow Neural Network...原创 2019-03-08 07:31:13 · 536 阅读 · 0 评论 -
Yelp NLP Text Classification Modeling 文本分类模型 featuring engineering
@Yelp NLP项目介绍 @文本预处理 @创建训练集和baseline model 以上三个文档,分别记录了NLP项目定义、文本预处理和标记训练集及基于prodigy的CNN模板训练出的基准模型,最终这个基准模型达到了83%的准确率。在此基础之上,我希望进一步优化模型的设计,将分类准确率提高至90%以上。prodigy的开发者曾给过一个很有趣的评价,即对于简单的文本分类问题来说,一个基本的(ba...原创 2019-03-08 12:17:15 · 547 阅读 · 1 评论