文章大纲 简介 工具库 中文提取 信息抽取 词法分析语料库 各类词库 句法分析语料库 词向量库 命名实体识别库 综合语料库 句法分析语料库 语料库的构建 标注工具 参考文献 简介 本文将持续更新,NLP中常见能够提高生生产效率的各类工具库,并给出样例代码 工具库 中文提取 Chinese extraction import re def Chinese_word_extraction(content_raw): chinese_pattern = u"([\u4e00-\u9fa5]+)" chi_pattern = re.compile