自然语言处理
weixin_38146606
这个作者很懒,什么都没留下…
展开
-
Python 英文分词
1. 按空格/符号分词 pattern = r'''(?x) # set flag to allow verbose regexps ([A-Z]\.)+ # abbreviations, e.g. U.S.A. | \w+(-\w+)* # words with optional internal hyphens | \$?\d+(\原创 2017-04-02 10:45:53 · 6477 阅读 · 1 评论 -
常用正则表达式
1. 获取两特征之间的字符 begin(.+?)end (字符不为空,最小匹配)原创 2017-04-15 12:53:04 · 183 阅读 · 0 评论 -
Python 正则表达式
1. 基本文法 import re expression = re.compile(reg) result = re.findall(expression, text) 2. 常用正则表达式原创 2017-04-15 12:41:49 · 232 阅读 · 0 评论 -
Python 中文分词
1. 安装jieba 打开cmd easy_install jieba 2. 分词 3. 关键词提取原创 2017-04-16 15:50:40 · 350 阅读 · 0 评论