为了实验首先在nltk_data中建立了一个实验文本文件,如下:
文字内容是:
hello this is a test sentence.
this is the second line haha.
第一行结尾键入回车,第二行没有回车。
然后实验结果如下:
在记事本里创建的文件,回车会按照两个字符处理,即:\r\n
标点符号也单独计入字符或者单词。
为了实验首先在nltk_data中建立了一个实验文本文件,如下:
文字内容是:
hello this is a test sentence.
this is the second line haha.
第一行结尾键入回车,第二行没有回车。
然后实验结果如下:
在记事本里创建的文件,回车会按照两个字符处理,即:\r\n
标点符号也单独计入字符或者单词。