交叉验证
#
# 接受一个大字符串并将其解析为字符串列表。
# 该函数去掉少于两个字符的字符串,并将所有字符串转换为小写。
#
def textParse(bigString): # input is big string, #output is word list
import re
listOfTokens = re.split(r'\W*', bigString)
return [tok.lower() for tok in listOfTokens if len(tok) > 2]
def spamTest<