有关程序效率问题
之前运行程序时,发现程序运行过于缓慢,跑了2个小时都没有结果,之后对代码进行分析,发现是代码设计时的问题,之前为了规范,将每个功能都封装为函数,其中有一个功能是获得停用词表,用于后面剔除,因为涉及到打开文件操作,所以防止内存泄露每次对文件操作都涉及关闭,但是在文本处理的函数中,我写的代码是循环的对文本以行位单位进行分词和剔除并形成列表,就造成了文本处理阶段,无用操作冗余,这也是造成代码运行缓慢的最大原因,所以对代码进行改进,将上述两个函数整合,并减少对文件的操作,这样代码的运行效率提升了几十倍。