自然语言预处理(英文) 1.可以自己定义预处理函数,使用正则表达式,将不想要的字符去除。 然后,打开要处理的文件,将文本进行处理。(实验中的数据是使用Tab制表符分开的英文句子,格式是:句子1,句子2,分数) 这样就处理完成。得到三个list。。。 当然,自然语言预处理绝非这么简单。这只是一小步。