第7章 处理文本数据
1.1思维导图
1.2代码
前期准备
机器学习新手必看:Jupyter Notebook入门指南
Jupyter Notebook介绍、安装及使用教程
问题1
输入jupyter notebook后提示——
‘jupyter’ 不是内部或外部命令,也不是可运行的程序
或批处理文件。
按照下面链接一通操作之后——
‘jupyter’ 不是内部或外部命令,也不是可运行的程序
输入jupyter notebook之后仍然提示——
‘jupyter’ 不是内部或外部命令,也不是可运行的程序
或批处理文件。
最终我找到了解决方案!!!
如下图所示:
找到jupyter notebook.exe所在的文件路径
在该路径下输入jupyter notebook即可打开对应的交互环境
(一)示例应用:电影评论的情感分析
(1)
参考链接:
tree -L n
!tree -L 2 /home/user/aclImdb
/bin/sh: 1: tree: not found
怀疑是路径问题,但是在下面加载和读取数据过程中没有问题——
(2)
from sklearn.datasets import load_files
reviews_train = load_files("/home/user/aclImdb/train/")
text_train, y_train = reviews_train.data,reviews_train.target
print("type of text_train:{}".format(type(text_train)))
print("length of text_train:{}".format(len(text_train)))
print(