yelpNLP
ruilinch_
这个作者很懒,什么都没留下…
展开
-
YELP NLP 文本信息提取项目
@YELP NLPYELP NLP (文本信息提取)为了做研究,进了Yelp这个大坑。自己选的题,哭着也得搞出来… 感觉边写代码边记录下心得体会、下一步的构想等等有的没的,是个很好的整理思路的过程。所以我接下来会长篇累牍地写自己在做这个项目的过程中所遇到的问题和可能的解决方法。挑来挑去,还是觉得CSDN的写博界面最友好,所以就在这里扎根啦。哦!我的NLP! I am coming!写在前...原创 2019-02-17 15:48:03 · 1404 阅读 · 0 评论 -
YELP NLP 英文文本断句
@关于Yelp NLP Project的介绍和问题设定STEP 1.2: SENTENCE TOKENIZATION WITH spaCy查了一些资料之后,我决定将reviews 和 sentences 的对应关系存在postgresql数据库里,方便以后随时检索和调整。我没有用Json文件来存,是因为之前做过一个比较大的项目,用json来存,检索的时候发现速度很慢。在检索速度上,还是关系型数...原创 2019-02-18 18:05:29 · 1782 阅读 · 0 评论 -
Yelp NLP Text Classification Modeling 文本分类模型 with Prodigy
@Yelp NLP项目介绍@文本预处理接下来,我需要:建立Training Set。搭建分类模型。因为这是个练手的项目,所以我想把不同的模型都试一下。以下是我想尝试的分类模型清单:Naive Bayes ClassifierLinear ClassifierSupport Vector MachineBoosting ModelsShallow Neural Network...原创 2019-03-08 07:31:13 · 570 阅读 · 0 评论 -
Yelp NLP Text Classification Modeling 文本分类模型 featuring engineering
@Yelp NLP项目介绍@文本预处理@创建训练集和baseline model以上三个文档,分别记录了NLP项目定义、文本预处理和标记训练集及基于prodigy的CNN模板训练出的基准模型,最终这个基准模型达到了83%的准确率。在此基础之上,我希望进一步优化模型的设计,将分类准确率提高至90%以上。prodigy的开发者曾给过一个很有趣的评价,即对于简单的文本分类问题来说,一个基本的(ba...原创 2019-03-08 12:17:15 · 606 阅读 · 1 评论