![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 89
机器学习
目标四级424
这个作者很懒,什么都没留下…
展开
-
机器学习:logistic回归算法及其python实现
def sigmoid(inX) : #sigmoid函数 return 1.0 /(1 + exp(- inX))原创 2023-02-15 15:35:09 · 1865 阅读 · 0 评论 -
机器学习:绘制PR曲线
在了解两条曲线之前,先来看下如下的混淆矩阵在一个二分类问题中把正例正确判定为正例,表示为TP(true positive)把正例错误判定为负例,表示为FN(false negative)把负例正确判定为负例,表示为TN(true negative)把负例错误判定为正例,表示为FP(false positive)Precision=TP/(TP+FP)Recall=TP/(TP+FN)TPR=TP/(TP+FN)FPR=FP/原创 2022-11-03 23:48:07 · 2808 阅读 · 0 评论 -
机器学习:朴素贝叶斯的应用之垃圾邮件过滤
此数据集包含训练集train与测试集test ,训练集里包含24个以txt格式存储的普通邮件文本与24个以txt格式存储的垃圾邮件文本,测试集里包含普通邮件与垃圾邮件文本各一个,结构树如下├─ Emails│ ├─ test│ ├─ …原创 2022-11-29 14:09:33 · 1329 阅读 · 0 评论 -
机器学习:KNN算法对鸢尾花进行分类
Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性iris以鸢尾花的特征作为数据来源,常用在分类操作中。该数据集由3种不同类型的鸢尾花的50个样本数据构成。其中的一个种类与另外两个种类是线性可分离的,后两个种类是非线性可分离的。四个属性:Sepal.Length(花萼长度),单位是cm;Sepal.Width(花萼宽度),单位是cm;Petal.Length(花瓣长度),单位是cm;原创 2022-11-13 22:15:46 · 5366 阅读 · 0 评论 -
机器学习:决策树进阶
C4.5算法中策略是采用二分法将连续属性离散化处理:假定样本集D的连续属性有n个不同的取值,对这些值从小到大排序,得到属性值的集合。把区间的中位点作为候选划分点,于是得到包含n-1个元素的划分点集合基于每个划分点t,可将样本集D分为子集和,其中中包含属性上不大于t的样本,包含属性a上大于t的样本。对于每个划分点t,按如下公式计算其信息增益值,然后选择使信息增益值最大的划分点进行样本集合的划分。剪枝(pruning)是决策树学习算法对付“过拟合”的主要手段。原创 2022-11-28 18:10:52 · 363 阅读 · 0 评论 -
机器学习:决策树算法(ID3算法)的理解与实现
1.分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部结点和叶 节点。内部结点表示一个特征或属性,叶节点表示一个类。决策树学习的目的是为了产生一个泛化能力强的决策树,用来预测未知事例。2.经典的决策树算法有ID3、C4.5、CART、RF等,由于本人是初学者,所以以下示例由ID3展开ID3作为一种经典的决策树算法,是基于信息熵来选择最佳的测试属性,其选择了当前样本集中具有最大信息增益值的属性作为测试属性。原创 2022-11-17 13:22:16 · 2121 阅读 · 0 评论 -
机器学习:支持向量机 (Support Vector Machine)算法原理及python实现
支持向量机(Support Vector Machine,SVM) 是一种用于分类问题的监督算法。SVM模型将实例表示为空间中的点,将使用一条直线(超平面)分隔数据点,且是两类数据间隔(边距:超平面与最近的类点之间的距离)最大。只通过几个支持向量就确定了超平面,说明它不在乎细枝末节,所以不容易过拟合,但不能确保一定不会过拟合。可以处理复杂的非线性问题。如图所示的几个将训练样本分开的超平面可能有很多,应选择”正中间”, 容忍性好, 鲁棒性高, 泛化能力最强。且此个超平面以最大边距将样本分开。原创 2023-02-14 22:24:21 · 1726 阅读 · 2 评论