- 博客(1)
- 收藏
- 关注
原创 NLP学习笔记——在Kaggle Notebook上使用多进程加速文本预处理,节约人生
前情提要 在学习NLP的新手教程Bag of Words Meets Bags of Popcorn这个比赛的Overview的教程里有一个把每篇文本切分成按句划分的单词list的预处理过程,原文的代码是这样的: sentences = [] # Initialize an empty list of sentences print "Parsing sentences from training set" for review in train["review"]: sentences +=
2020-09-10 23:27:00 653 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人