NLP学习笔记——在Kaggle Notebook上使用多进程加速文本预处理,节约人生
前情提要
在学习NLP的新手教程Bag of Words Meets Bags of Popcorn这个比赛的Overview的教程里有一个把每篇文本切分成按句划分的单词list的预处理过程,原文的代码是这样的:
sentences = [] # Initialize an empty list of sentences
print "Parsing sentences from training set"
for review in train["review"]:
sentences +=
原创
2020-09-10 23:27:00 ·
653 阅读 ·
1 评论