Python自然语言处理-学习笔记(6) ——— 文本分类

分类器学习

规律总结:
1.以n、ch结尾的倾向于男性
2.以yn、h结尾的倾向于女性

from nltk import *
函数名称解释
gender_feature = {feature_name:feature_value}
tarin_set = [({feature_name:feature_value},tag)]
classifier = NaiveBayesClassifier.train(train_set)
classifier.classify()
classifier.show_most_informative_features(n)
朴素贝叶斯分类器
(首先构建一个特征提取器gender_feature)

分类
展示前n个对分类最有效的特征
from nltk.classify import *
函数名称解释
accuracy(classifier,test_set)
评估分类准确率
apply_features(gender_feature,train_set)返回一个类似于List但不会在内存中存储所有特征集的对象
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值