- 博客(1)
- 资源 (3)
- 收藏
- 关注
原创 python-----简单英文语料预处理
英文语料预处理的主要步骤: (此步骤针对的是txt格式的文件,如果文件为其他格式,需要先将其转换为txt文件再进行操作) 1、去除非英文字符的字符,例如符号、数字、中文等 2、去停用词 具体实现(python具体实现): 1、去除非英文字符 在python中使用re模块对非英文字符进行判断和替换: 使用re.compile()匹配出txt文件中的非英文字符,将要进行查找的字符放...
2018-07-16 16:25:39 4200
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人