自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Yelp NLP Text Classification Modeling 文本分类模型 featuring engineering

@Yelp NLP项目介绍 @文本预处理 @创建训练集和baseline model 以上三个文档,分别记录了NLP项目定义、文本预处理和标记训练集及基于prodigy的CNN模板训练出的基准模型,最终这个基准模型达到了83%的准确率。在此基础之上,我希望进一步优化模型的设计,将分类准确率提高至90%以上。prodigy的开发者曾给过一个很有趣的评价,即对于简单的文本分类问题来说,一个基本的(ba...

2019-03-08 12:17:15 545 1

原创 Yelp NLP Text Classification Modeling 文本分类模型 with Prodigy

@Yelp NLP项目介绍 @文本预处理 接下来,我需要: 建立Training Set。 搭建分类模型。因为这是个练手的项目,所以我想把不同的模型都试一下。以下是我想尝试的分类模型清单: Naive Bayes Classifier Linear Classifier Support Vector Machine Boosting Models Shallow Neural Network...

2019-03-08 07:31:13 534

原创 YELP NLP 英文文本断句

@关于Yelp NLP Project的介绍和问题设定 STEP 1.2: SENTENCE TOKENIZATION WITH spaCy 查了一些资料之后,我决定将reviews 和 sentences 的对应关系存在postgresql数据库里,方便以后随时检索和调整。我没有用Json文件来存,是因为之前做过一个比较大的项目,用json来存,检索的时候发现速度很慢。在检索速度上,还是关系型数...

2019-02-18 18:05:29 1726

原创 YELP NLP 文本信息提取项目

@YELP NLP YELP NLP (文本信息提取) 为了做研究,进了Yelp这个大坑。自己选的题,哭着也得搞出来… 感觉边写代码边记录下心得体会、下一步的构想等等有的没的,是个很好的整理思路的过程。所以我接下来会长篇累牍地写自己在做这个项目的过程中所遇到的问题和可能的解决方法。 挑来挑去,还是觉得CSDN的写博界面最友好,所以就在这里扎根啦。 哦!我的NLP! I am coming! 写在前...

2019-02-17 15:48:03 1376

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除