CC

Make something different!

NLTK学习(三)

本篇博客转自:NLTK学习之三:文本分类与构建基于分类的词性标注器 学习记录所用,如有侵权,立即删除。 一、有监督的分类 1、分类 分类时为给定输入选择正确的类标签的任务。比如判断一封Email是否是垃圾邮件,确定一篇新闻的主题。如果分类的时候需要人工标注的标签进行训练,则称为有监督的分类...

2018-09-23 11:45:27

阅读数 321

评论数 0

NLTK学习(二)

转载自:NLTK学习之二:建构词性标注器 学习所用,如有侵权,立即删除。 词性标注,或POS(Part Of Speech),是一种分析句子成分的方法,通过它来识别每个词的词性。下面简要列举POS的tagset含意,详细可看nltk.help.brown_tagset() 标记 词性 ...

2018-09-17 10:32:06

阅读数 199

评论数 0

jieba分词器学习

转载自:好玩的分词——python jieba分词模块的基本用法 学习记录所用,如有侵权,一定删除。 结巴分词分为三种模式:精确模式(默认)、全模式和搜索引擎模式。 精确模式: import jieba s = '武汉大学是一所还不错的大学' result = jieba.cut(s) ...

2018-09-16 15:48:29

阅读数 154

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭