文本处理
cacn2013
学生
展开
-
如何提取一篇英文文章的所有单词
import string fin = open(filename) words = [] count = 0 for line in fin: line = line.replace('-',' ') for word in line.split(): word = word.strip(string.punctuation + string.whitespace) word =原创 2014-12-17 22:07:59 · 5333 阅读 · 0 评论 -
如何提取每个单词所出现的句子
import string import operator fin = open(filename) par = ' ' part = {} words = [] for line in fin: line = line.strip() pa = ''.join([line,'']) par = ''.join([par, pa]) par = par.replace('?', '.'原创 2014-12-17 22:09:55 · 936 阅读 · 0 评论