一点幼稚的记录

做机器学习一个简单的任务,熟悉贝叶斯算法

虽然很简单,但因为各种不熟悉,摸索了好久。。。因此也还是记录一下。

写完感觉其实也不多,但在过程中总觉的各种不会,各种纠结。


错误:
1、文件读取
错误:SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape
原因:原来是由于\u之类的存在,导致了python进行转义,从而找不到目录下面对应的文件了。。多加个\即可。

ataset=np.loadtxt('C:\Users\LENOVO\Desktop\新建文件夹\data_banknote_authentication.txt',delimiter=",")
加一条‘\’改为
ataset=np.loadtxt('C:\\Users\LENOVO\Desktop\新建文件夹\data_banknote_authentication.txt',delimiter=",")


2、
错误:TypeError: fit() missing 1 required positional argument: 'y'
原因:model = GaussianNB 应该为 model = GaussianNB()

3、

当使用MultinomialNB时,测试时会出现:ValueError: Input X must be non-negative(输入应为非负的)
改为GaussianNB,一切正常
改为BernoulliNB,也正常

4、accuracy_score(还有其他,这次没用上)
分类准确率分数是指所有分类正确的百分比。分类准确率这一衡量分类器的标准比较容易理解,但是它不能告诉你响应值的潜在分布,并且它也不能告诉
你分类器犯错的类型。
形式:
sklearn.metrics.accuracy_score(y_true, y_pred, normalize=True, sample_weight=None)
normalize:默认值为True,返回正确分类的比例;如果为False,返回正确分类的样本数


6、
混淆矩阵分别输出正负样本中出错的样本数:print(metrics.confusion_matrix(train_y, result))


7、
metrics.classification_report
recall 体现了分类模型H对正样本的识别能力(TP/(TP+FN))
precision 体现了模型对负样本的区分能力(TP/(TP+FP))
F1-score 是两者的综合。F1-score 越高,说明分类模型越稳健。



from sklearn.naive_bayes import BernoulliNB
from sklearn import metrics
import numpy as np
dataset=np.loadtxt('C:\\Users\LENOVO\Desktop\新建文件夹\data_banknote_authentication.txt',delimiter=",")

train_X=dataset[:,0:4]
train_y=dataset[:,4]

model = BernoulliNB()
model.fit(train_X,train_y) 

result=model.predict(train_X)
print(metrics.classification_report(train_y, result))
#混淆矩阵分别输出正负样本中出错的样本数
print(metrics.confusion_matrix(train_y, result))

print('accuracy:%.2f'% metrics.accuracy_score(train_y, result))
print('accuracy:%.2f'% metrics.accuracy_score(train_y, result, normalize=False))


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值