from __future__ import division
import re
from numpy import ones, array
from numpy.lib.scimath import log
from nltk import *
def loadDataSet():
pos=open("pos_train.txt",'r')
neg=open("neg_train.txt",'r')
lst_all=[]
classVec=[]
for i in range(700):
classVec.append(i%2)
for i in range(350):
str0=pos.readline()
str1=neg.readline()
regEx0=re.compile('\\W*')
regEx1=re.compile('\\W*')
lst_pos=regEx0.split(str0)
lst_neg=regEx1.split(str1)
lst_all.append([tok.lower() for tok in lst_pos if len(tok)>0])
lst_all.append([tok.lower() for tok in lst_neg if len(tok)>0])
return lst_all,classVec
def loadTestSet():
pos=open("pos_test.txt",'r')
neg=open("neg_test.txt",'r')
lst_pos_test=[]
lst_neg_test=[]
for i
Python贝叶斯算法进行情感分析
最新推荐文章于 2024-07-31 21:10:09 发布
该博客通过Python实现了一个基于贝叶斯算法的情感分析模型。首先,从训练文件中加载数据并创建词汇表,然后将文本转换为词袋向量,接着训练贝叶斯分类器。最后,使用测试集评估模型的准确率,分别计算正向和负向文本的分类精度。
摘要由CSDN通过智能技术生成