参考博客:http://blog.csdn.net/u013508213/article/details/52326420
【邮件预处理】
%regexprep对字符串查找并替换
A、输入:email_contents
- 将整封邮件单词转换为小写 lower(email_contents)
- 去除所有的html格式<> regexprep(email_contents,'<[^<>]+>', ' ')
- 将数字替换为'number' regexprep(email_contents, '[0-9]+','number')