教你一步步如何搭建一个电影评论分类系统,本篇文章是这系列的第二篇
这篇文章主要介绍如何将文本转换为特征向量前的一些准备工作,主要内容包括:
1、清洗文本数据
2、标记文档
3、词袋模型
一、清洗文本数据
清洗文本需要将文本中所包含的一些不必要的字符删除。
1、删除不必要的字符
print(data["review"][0
教你一步步如何搭建一个电影评论分类系统,本篇文章是这系列的第二篇
这篇文章主要介绍如何将文本转换为特征向量前的一些准备工作,主要内容包括:
1、清洗文本数据
2、标记文档
3、词袋模型
一、清洗文本数据
清洗文本需要将文本中所包含的一些不必要的字符删除。
1、删除不必要的字符
print(data["review"][0