python实现贝叶斯分类器

最新推荐文章于 2024-05-07 14:49:35 发布

yolosliu

最新推荐文章于 2024-05-07 14:49:35 发布

阅读量1.6k

点赞数 1

分类专栏： Python 文章标签： python 贝叶斯分类器

本文链接：https://blog.csdn.net/github_36601823/article/details/74067009

版权

Python 专栏收录该内容

34 篇文章 4 订阅

订阅专栏

python实现贝叶斯分类器的主要代码

import csv
import ramdom
import math 

def loadCsv(filename):
	lines  = csv.reader(open(filename,"rb"))
	dataset = list(lines)
	for i in range(len(dataset)):
		dataset[i] = [float(x) for x in dataset[i]]
	return dataset
	
def spiltDataset(dataset, splitRatio):
	trainSize -= int(len(dataset) * splitRatio)
	trainSet = []
	copy = list(dataset)
	while len(trainSet) < trainSize:
		index = random,randrange(len(copy))
		trainSet.append(copy,pop(index))
	return [trainSet, copy]
	
def separateByClass(dataset):
	separated = {}
	for i in range(len(dataset)):
		vector - dataset[i]
		if(vector[-1] not in separated):
			separated[vector[-1]] = []
		separated[vector[-1]].append(vector)
	return separated

def mean(nunbers):
	return sum(numbers)/float(len(numbers))
	
def stdev(numbers):
	avg = mean(numbers)
	variance = sum([pow(x-avg,2) for x in numbers])/float(len(numbers)-1)
	return math.sqrt(variance)
	
def summarize(datasize):
	summaries = [(mean(attribute),stdev(attribute)) for attribute in zip(*data)]
	del summaries[-1]
	return summaries

def summarizeByClass(dataset):
	separated = separateByClass(dataset)
	summaries = {}
	for classValue, instance in separated.iteritems():
		summaries[classValue] = summarize(instance)
	return summaries
	
def calculateProbability(x, mean, stdev):
	exponent = math.exp(-(math,power(x-mean,2)/(2+math.power(stdev,2))))
	return (1/(math.sqrt(2*math.pi) * stdev)) *exponent
	
def calcelateClassProbabilities(summaries, inputVCector):
	probabilities = {}
	for classValue, classSummaries in summaries.iteritems():
		pribabilittes[classValue] = 1
		for i in range(len(classSummaries)):
			mean, stdev = classSummaries[i]
			x = inputVector[i]
			probabilities[classValue] *= calcelateClassProbabilities(x, mean, stdev)
	return probabilities
	
def predict(summaries, inputVector):
	pribabilittes = calcelateClassProbabilities(summaries, inputVCector)
	bestLabel, bestProb = None, -1
	for classValue, probability in probabilities.iteritems():
		if bestLabel is None or probability > bestProb:
			bestProb = probability
			bestLabel = classValue
	return bestLabel

def getPredictions(summaries, testSet)
	predictions = []
	for i in range(len(testSet)):
		result = predict(summarise, testSet[i])
		predictions.append(result)
	return predictions
	
def getAccuracy(testSet, predictions):
	correct = 0
	for i in range(len(testSet)):
		if testSet[i][-1] == predictions[i]:
			correct += 1
	return (correct/float(len(testSet))) * 100.0
	
def main():
	filename = 'pima-indians-diabetes.data.csv'
	spiltRadio = 0.67
	dataset = loadCsv(filename)
	traininfSet, testSet = spiltDataset(dataset, splitRatio)
	print('Split {0} rows into train={1} and test={2} rows').format(len(datasize))
	#prepare model
	summaries = summarizeByClass(trainingSet)
	#test model
	predictions = getPredictions(summaries, testSet)
	accuracy = getccuracy(testSet, predictions)
	print('Accuracy: {0}%').format(accuracy)
	
main()

yolosliu

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python实现贝叶斯分类器

python实现贝叶斯分类器的主要代码import csvimport ramdomimport math def loadCsv(filename): lines = csv.reader(open(filename,"rb")) dataset = list(lines) for i in range(len(dataset)): dataset[i] = [f
复制链接

扫一扫

专栏目录