sklearn/naive_bayes/训练/分类

最新推荐文章于 2021-11-21 14:22:25 发布

apple-nul

最新推荐文章于 2021-11-21 14:22:25 发布

阅读量502

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/wanpi931014/article/details/80047456

版权

python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

# -*- coding: utf-8 -*-
"""
Created on Mon Apr 23 10:39:20 2018

@author: NAU
"""

# -*- coding: utf-8 -*-
"""
Created on Sun Apr 22 19:29:14 2018

@author: NAU
"""

#导入包
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.naive_bayes import MultinomialNB

#导入文件
f = open('E:\\train.txt', 'r')
train=f.read()
f.close()
data = []
train_content=[]
train_target=[]
lines=train.strip().split('\n')
for line in lines:
one = line.strip().split(',')
data.append((one[0], one[1]))
train_content.append(one[0])
train_target.append(one[1])
# train_content = data[:1]
# train_target = data[1:]

vectorizer = CountVectorizer()
transformer = TfidfTransformer()
tfidf=transformer.fit_transform(vectorizer.fit_transform(train_content))
word = vectorizer.get_feature_names()
weight = tfidf.toarray()

clf = MultinomialNB().fit(tfidf, train_target)

#准确率计算
new_tfidf = transformer.fit_transform(vectorizer.transform(train_content))
predicted = clf.predict(new_tfidf)
print (predicted)
trueNum=0;
for i in range(0,len(train_content)):
if predicted[i]==train_target[i]:
trueNum=trueNum+1
i=i+1
a=trueNum/len(train_content)
print("精确度："+str(a))

#预测数据
docs = []
ft = open('E:\\test.txt', 'r')
train=ft.read()
ft.close()
docs=train.strip().split('\n')
new_tfidf = transformer.fit_transform(vectorizer.transform(docs))
predicted = clf.predict(new_tfidf)
print (predicted)

apple-nul

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
sklearn/naive_bayes/训练/分类

# -*- coding: utf-8 -*-"""Created on Mon Apr 23 10:39:20 2018@author: NAU"""# -*- coding: utf-8 -*-"""Created on Sun Apr 22 19:29:14 2018@author: NAU"""#导入包from sklearn.feature_extracti
复制链接

扫一扫

专栏目录