- 博客(19)
- 资源 (1)
- 收藏
- 关注
原创 判别分析数学原理推导-实战(基于R语言的mlr,tidyverse;Python-sklearn)
判别分析(Discriminant analysis)是一种统计分析方法,旨在通过将一组对象(例如观察数据)分类到已知类别的组中,来发现不同组之间的差异。判别分析有两种主要形式:线性判别分析(LDA)和二次判别分析(QDA)。LDA假设每个类别的协方差矩阵相同,并寻找最优的判别方向来最大化类别之间的距离。QDA假设每个类别的协方差矩阵都不同,并寻找最优的判别方向来最大化类别之间的距离,同时也考虑了每个类别的协方差矩阵。
2023-06-11 23:20:37 647 2
原创 基于R语言中的mlr以及Python中的sklearn的逻辑回归算法实战
尽管我们的模型在整体的准确率(accuracy)为80%,但是该模型将百分之三十的死亡乘客预测成了幸存乘客;而将百分之十三的幸存乘客预测成了死亡乘客。由此可知,我们上面的模型并没有将数据集中的有效信息完全挖掘出来,因此,准确率并不是最重要的性能度量指标,尤其是在因变量分布不均衡时。lnp1−pβ0β1x1β2x2⋯βkxkln1−ppβ0β1x1β2x2⋯βkxk,其中pppppp。
2023-06-10 20:52:13 865
原创 利用R语言中的tidyverse和mlr建立分类算法-KNN
KNN(K-Nearest Neighbors)算法是一种基本的分类和回归算法,它是一种非参数算法,可以用于分类和回归问题。它的基本思想是利用已有的数据集对新的数据进行分类或回归。在分类问题中,KNN算法通过测量不同特征之间的距离来确定新数据点与训练数据集中最相似的K个数据点,然后将新数据点分类为这K个数据点中出现最频繁的类别。在回归问题中,KNN算法使用与分类问题相同的基本思想,但是它计算的是K个最近邻点的平均值或加权平均值,然后将该平均值作为新数据点的回归结果。
2023-06-09 18:45:14 775
原创 决策树分类算法Python手动复现,ID3,C4.5,CART,预剪枝,后剪枝
关于决策树分类算法本人除了以上Python版本,还有MATLAB版本以及R语言版本,所有的代码以及数据集请参考本人的。我们将自己写的决策树分类算法与sklearn中的决策树分类进行比较(基于心脏病二分类数据集),即可获得整个项目的代码以及数据集。(路过的小伙伴给博主小哥点个。,在公众号的对话框内回复。
2023-05-07 15:26:57 774 1
原创 浙江理工大学本科毕业答辩beamer模板
浙江理工大学本科毕业答辩beamer模板写在前面配置环境beamer示例代码展示效果写在前面此beamer模板是在TeXstudio软件上进行编写,对beamer不是很熟悉的同学可以参考我的CSDN主页中的其中一篇博客: latex Beamer模板.升级版beamer可以选择参考升级版beamer模板配置环境代码中所需要的所有图片都放在figures文件内首先是建立一个cls文件,主要是配置一些需要的包,对页眉页脚以及行距、主题等其他条件进行设置。具体代码如下:\ProvidesClass{z
2022-05-30 19:08:18 1403
原创 beamer升级排版详细代码
本次升级了beamer的一些代码。带有动画,视频链接等。\documentclass{beamer}\usepackage{multimedia}\usepackage{xcolor}\usepackage[UTF8,heading=true]{ctex}\usepackage{animate}%%%%%%下面的命令可以让超链接具有颜色,便于识别%%%%%%%%%%%%%%%%%%%%\usepackage{hyperref}\hypersetup{ colorlinks=true, l
2022-04-13 14:54:29 967
原创 Python学习numpy(一维数组)保姆级别教学
Numpy软件库提供了对于数组进行高速处理的ndarray类。生成ndarray类的方法之一是使用Numpy的np.array()函数,使用np.array(列表)语句,通过传入的列表创建ndarray实例。同时也可以使用np.arrange()函数###实例一:创建一维ndarray类import numpy as npeg1=np.array([1,2,3]) #输出一维数组[1,2,3]eg2=np.arange(4) #输出0到3的一维数组eg11=[1,2,3] #创建列表e
2022-04-10 10:15:50 5884
原创 MATLAB关于xlsread函数的用法
直接上代码理解:%matlab中的xlsread是用来读取xls文件的一个函数,但是当文件中的数据类型有所不同时,代码也会发生变化。%% 当xls文件中的数据类型都是数值型时:%num=xlsread('filename','sheet','range')%filename是指文件地址\文件名.xls(或xlsx)%sheet是表格页名%range是指要导入数据的范围clear,clc,num=xlsread('demo1.xls','sheet2','B1:B20'), %读取demo1.
2022-03-19 20:22:50 32431
原创 整数线性规划习题一
习题2.2某市为方便小学生上学,拟在新建的8个居民小区A1,A2,...,A8A_1,A_2,...,A_8A1,A2,...,A8增设若干小学,备选校址有B1,B2,...,B6B_1,B_2,...,B_6B1,B2,...,B6,他们能够覆盖的居民小区如下表所示:备选校址B1B_1B1B2B_2B2B3B_3B3B4B_4B4B5B_5B5B6B_6B6覆盖的居民小区A1,A5,A7A_1,A_5,A_7A1,A5,A7A1,A2,A
2022-03-13 09:37:35 2507 1
原创 朴素贝叶斯算法matlab代码详细解释
T = xlsread('data1.xlsx',1,'A1 : C1628');x = T(:,1); %横坐标向量y = T(:,2); %纵坐标向量c = T(:,3); %类标签向量data = [x,y]; %训练样本矩阵k = 1500; %样本数量T1 = sortrows([x(1:k,1),y(1:k,1),c(1:k,1)],3);%为方便处理按类这一列对样本进行升序排序(整个行的变化会和这一列的变化相同),如果是-3就是降序排列%T1temp = zeros(23
2022-03-05 10:51:56 2513
原创 第二章:机器学习的流程
文章目录2.1 机器学习流程的简介2.1.1 进行机器学习的整体流程2.1.2 数据的学习2.2 学习数据的使用方法2.2.1 学习数据与测试数据2.2.2 留出法的理论与实践2.2.3 k折交叉验证的理论2.2.4 k折交叉验证的实践2.3 过拟合2.3.1 什么是过拟合2.3.2 如何避免过拟合2.4 集成学习2.1 机器学习流程的简介2.1.1 进行机器学习的整体流程接下来对三类机器学习方法应用最多的“监督学习”的实现流程进行阐述。监督学习的实现流程可以归纳为以下步骤:收集数据数据清洗(清
2022-02-05 11:26:33 2134
原创 各类机器学习算法
文章目录理解监督学习理解无监督学习理解强化学习理解监督学习首先要理解“监督学习”中的“监督”二字,何为“监督”?监督是指数据中带有的“标签”,通常是对特征的判断,进行类别划分。比如橘子的甜或者不甜,音乐的喜欢或者不喜欢。标签又分数值型标签和“标称型标签”,如果目标变量是标称型的,那么该问题就是分类问题,例如一种药品药效的好与坏,我们可以用数字1代表药效的好,药效的坏用数字0代表,这样yi∈{0,1}y_i \in \{0,1\}yi∈{0,1};如果目标变量是数值型,通常是连续型的,那么该问题通常就是
2022-02-03 15:48:29 1203
原创 机器学习第一章(简介)
1.1机器学习简介1.1.1本文说明及开发环境的准备1.1.2 机器学习为何如此热门1.1.3 何谓机器学习1.1.1本文说明及开发环境的准备本人机器学习的开发环境是Python,编辑器是pycharm,当然你也可以使用Anaconda.以后的文章都是基于读者已经安装了开发环境的前提下所写,以后会定期更新机器学习相关的博客(包括原理和Python代码),在这里我给读者收集到了pycharm和Anaconda的安装步骤:pycharm安装步骤: 网页链接.Anaconda安装步骤: 网页链接.1.
2022-02-03 11:01:29 1291
数学建模与机器学习领域中的蒙特卡罗模拟,压缩包内含有蒙特卡罗方法在各个方面应用的详细介绍,同时含有matlab,python代码
2022-02-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人