自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 贝叶斯算法原理及实现

(一)原理设每个数据样本用一个n维特征向量来描述n个属性的值,即:X={x1,x2,…,xn},假定有m个类,分别用C1, C2,…,Cm表示。给定一个未知的数据样本X(即没有类标号),若朴素贝叶斯分类法将未知的样本X分配给类Ci,则一定是P(Ci|X)>P(Cj|X) 1≤j≤m,j≠i根据贝叶斯定理有P(Ci|X)=P(X|Ci)P(Ci)/ P(X)由于P(X)对于所有类为常数,最大化后验概率P(Ci|X)可转化为最大化先验概率P(X|Ci)P(Ci)。如果训练数据集有许多属性和元组,

2020-09-08 12:13:37 2613 1

原创 将数据集类标签数字化

将数据集类标签数字化该数据集来自datingTestSet.txt//打开旧文件f = open('dataset/datingTestSet.txt','r',encoding='utf-8')//打开新文件f_new = open('dataset/datingTestSet0.txt','w',encoding='utf-8')//循环读取旧文件for line in f: labels=['didntLike','smallDoses','largeDoses'] ne

2020-07-11 18:44:20 1018

原创 KNN算法及代码实现

KNN算法(K Nearest Neighbors)KNN算法是有监督学习(Supervised Learning)算法中的一种。KNN算法的原理简单来说就是当预测一个新的值x的时候,根据距离它最近的K个点的类别来判断x属于哪个类别。KNN算法的一般流程包含以下几个步骤:(1)收集数据:可以使用任何方法。(2)准备数据:距离计算所需要的数值,最好是结构化的数据计算格式。(3)分析数据:可以使用任何方法。(4)训练算法:此步骤不适用于K-近邻算法。(5)测试算法:计算错误率。(6)使用算法:首

2020-06-19 20:24:11 1350

原创 评估分类器性能的常用度量

评估分类器性能的常用度量的链接地址评估分类器性能的常用度量一.基本的术语正元组:感兴趣的主要类的元组负元组:其他元组例如:给定两个类,正元组可能是buys_computer=yes,负元组是buys_computer=no。真正例/真阳性(True Positive,TP):是指被分类器正确分类的正元组。令TP为真正例的个数。真负例/真阴性(True Negative,TN):是指被分类器正确分类的负元组。令TN为真负例的个数。假正例/假阳性(False Positive,FP):是被错误地

2020-06-12 17:16:02 1882

评估分类器性能的度量.docx

该评估分类器性能的度量是我在学习过程中根据数据挖掘这本书总结的笔记,希望能够加深对知识点的理解与应用,有助于后期的学习、进步。

2020-06-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除