自然语言处理(NLP) 四：性别识别

最新推荐文章于 2022-05-18 17:19:50 发布

爱跑步的george

最新推荐文章于 2022-05-18 17:19:50 发布

阅读量2.1k

点赞数

分类专栏：自然语言处理

本文链接：https://blog.csdn.net/weixin_38246633/article/details/80639349

版权

自然语言处理专栏收录该内容

6 篇文章 2 订阅

订阅专栏

import random 
import numpy as np 
import nltk.corpus as nc 
import nltk.classify as cf 
male_names = nc.names.words('male.txt')
female_names = nc.names.words('female.txt')
models,acs = [],[]
for n_letters in range(1,6):
    data = []
    for male_name in male_names:
        feature = {'feature':male_name[-n_letters:].lower()}
        data.append((feature,'male'))
    for female_name in female_names:
        feature = {'feature':female_name[-n_letters:].lower()}
        data.append((feature,'female'))
    random.seed(7)
    random.shuffle(data)
    train_data = data[:int(len(data)/2)]
    test_data = data[int(len(data)/2):]
    model = cf.NaiveBayesClassifier.train(train_data)
    ac = cf.accuracy(model,test_data)
    models.append(model)
    acs.append(ac)
best_index = np.array(acs).argmax()
best_letters = best_index + 1
print(best_letters)
best_model = models[best_index]
best_ac = acs[best_index]
print(best_letters,'%.2f%%'%round(best_ac*100,2))
names = ['Leonardo','Amy','Sam','Tom','Katherine','Taylor','Susanne','Watermelon','Alpaca','Paris','Python','Java']
print(names)
genders = []
for name in names:
    feature = {'feature':name[-best_letters:]}
    gender = best_model.classify(feature)
    genders.append(gender)
print(genders)

爱跑步的george

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
自然语言处理(NLP) 四：性别识别

import random import numpy as np import nltk.corpus as nc import nltk.classify as cf male_names = nc.names.words('male.txt')female_names = nc.names.words('female.txt')models,acs = [],[]for n_le...
复制链接

扫一扫