自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(98)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 机器学习之数据预处理(一):缺失值处理和异常值识别的几种常用方法

例如,对数据集[5,10,11,13,15,35,50,55,72,92,204,215],设置分箱数为3,一共分成三个区间。价格的排序后数据(美元):2,6,7,9,13,20,21,25,30。使用等深方法进行划分,划分后的结果为:Bin1=[2,6,7],Bin2=[9,13,20],Bin3=[21,24,30]。由于分箱方法参考邻居的值,所以它进行的是局部平滑。☛规范化:将属性数据按比例缩放,使之落入一个特定的区间,如[-1,1]或者[0,1],以便消除属性之间的量纲和取值范围差异的影响。

2025-04-06 22:15:53 746

原创 使用Python的turtle绘制奥运五环、不一样的小星星(代码可运行)

turtle.tracer(n)打开或者关闭turtle动画。通常使用turtle.tracer(0)实现瞬间画图功能。画出20个五角星太慢了,即时speed(0)也还是很慢。n=4:在循环中,图形将一次画出4次循环的图。n=1:图形按照正常速度进行,可有可无。设置画笔粗细pen.pensize()n=0:图形将一次性画好。

2025-02-04 22:53:59 402

原创 讲清逻辑回归算法,剖析其作为广义线性模型的原因

逻辑回归模型本质就是将线性回归模型通过Sigmoid函数进行了一个非线性转换,将线性回归的结果(−∞,+∞)转换到一个介于0~1之间的概率值。的,其y的取值范围为(−∞,+∞),而逻辑回归模型是用于预测类别的,例如,用逻辑回归模型预测一个人是否会违约、客户是否会流失,在本质上预测的是一个人是否违约、是否流失的概率,而概率的取值范围是0~1,因此不能直接用线性回归方程来预测概率。当y值趋向正无穷(+∞)时,f(y)的值趋向于1,且函数的值域为(0,1)。方程式的左边是对数比值比,右边是线性方回归。

2025-02-03 19:01:39 668

原创 并行计算、分布式计算与云计算:概念剖析与对比研究(表格对比)

大规模并行计算机出现后,以其为基础的云计算服务器集群的服务器数量是以万、十万甚至更高的单位计数,在这样巨大的集群规模下,云计算面临两个重要问题:昂贵的系统部署费用和不可忽视的结点失效问题。即并行程序并行处理的任务包之间有很大的联系,并且并行计算的每一个任务块都是必要的,没有浪费的、分割的,就是每个任务包都要处理,而且计算结果相互影响,这就。由于服务器的大量集中,服务器的失效成为经常的事情,传统的架构对于单点失效是很敏感的,而在云计算架构下,任何的单点失效都不会影响系统对外提供服务。什么是云计算的概念。

2025-02-03 18:55:16 1797 1

原创 用Python实现线性回归算法预测客户价值(含运行代码)

以信用卡客户的客户价值为例来解释客户价值预测的具体含义:客户价值预测就是指预测客户在未来一段时间内能带来多少利润,其利润可能来自信用卡的年费、取现手续费、分期手续费、境外交易手续费、信用卡贷款等。样本数据共有128组,数据集中变量的详细描述如下表所示,表格中的“客户价值”列为目标变量(因变量),剩下的字段为特征变量(自变量)。针对高价值客户提供区别于普通客户的服务,以进一步挖掘这些高价值客户的价值,并提高他们的忠诚度,这样可以将有限的资源进行合理化的配置,提供客户的满意度。(2)提取特征变量和目标变量。

2025-01-25 17:56:42 478

原创 线性回归算法全攻略:详尽介绍与核心实现原理精讲

由于建立回归方程的目的是寻找y随x变化的规律,如果回归方程所有的系数值都为0,那么不管x如何变化,y不随x的变化作线性变化,那么这时求得的线性回归方程就没有意义,称回归方程不显著;其中,y是因变量,x是自变量,α是回归常数,β为回归系数,分别表示直线在Y轴的截距和直线的斜率。线性回归算法是最简单的回归形式,主要用于研究因变量(响应变量,目标变量)和自变量(预测变量)之间的关系,随着自变量的变化,因变量也会随之发生变化。,xp为不同的自变量,β1,β2,…,βp则为这些自变量前的回归系数,β0为回归常数,

2025-01-25 17:51:20 1220

原创 精讲Python之turtle库(二):设置画笔颜色、回旋伞、变色回旋伞、黄色三角形、五角星,附源代码

rgb用3个0~255数字表示颜色,例如(0,0,0),(100,20,50),(255,255,255)使用rgb模式的颜色,rgb模式的颜色几乎包括了人类视力所能感知的所有颜色。,这篇文章已经介绍了turtle库的基本知识点,现对进阶的功能进行讲解。当三个数字是最大值时:255,255,255,表示白色。255,255,0-黄色(红色+绿色=黄色)当三个数字都是0的时候,0,0,0表示黑色。第一个数字r表示红色的比重。第三个数字b表示蓝色的颜色。255,0,0-红色(亮)100,0,0-红色(暗)

2025-01-23 22:31:37 1105

原创 精讲Python之turtle(海龟)库(一):原理及例子精讲

当speed()函数接受一个整数作为参数时,该整数的范围通常是0到10:0:最快速度。"slow":较慢速度(与整数3相同)。"normal":正常速度(6默认值,通常对应于某个介于1和10之间的速度)。如果没有turtle.done(),这个窗口可能会在你的程序执行完毕后立即关闭,导致你看不到最终的绘图结果。这个函数接受一个参数,该参数可以是一个整数或一个字符串,用于指定turtle移动的快慢。Turtle模块是python中专门用来画图的模块,通过程序控制海龟的来回移动,移动的轨迹就是所画的图形。

2025-01-20 23:40:33 751

原创 并行计算:从概念起源到多层次架构设计及其发展历程的全面解析

20世纪70年代,第一台并行计算机于1972年产生(ILLIAC IV,伊利诺依大学),由64个处理器组成,可扩展性好,但可编程性差。如有21亩地需要除草,一个人一天只能除一亩地的草,那么需要21天才能除完草,这在现实中是不太可能的,因庄稼是有时间段的。其二是机群系统是高性能计算机的一种,它的技术基础和工业基础都是商品化和标准化。之所以称为“专用”,并不是说它们只能运行某种应用,是指它们的组成部件是专门设计的,它们的CPU板、内存板和I/O板,甚至操作系统,都是不能在其它系统中使用的。

2025-01-20 22:01:12 1265

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之一维数组(应用技巧)

根据题意,可以采用打标记的思想来解决此问题,首先定义一个布尔类型数组,数组元素为0表示灯处于亮的状态,1为灯处于熄灭的状态,起始值都为0,这里需要注意由于灯的编号从1到k,所以数组元素在初始时,从下标为1开始;例如,129~137:129,130,131,132,133,134,135,136,137。统计后发现:“0”出现了1次,“1”出现了10次,“2”出现了2次,“3”出现了9次,“4”出现了1次,“5”出现了1次,“6”出现了1次,“7”出现了1次,“8”出现了0次,“9”出现了1次。

2025-01-19 23:22:29 750

原创 用Python实现SVM搭建金融反诈模型(含调试运行)

剩下的字段为特征变量,只选取了5个特征变量,在实际中使用的特征变量远很多,根据这些数据搭建支持向量机模型。可见对于判断是否欺诈,模型的 precision(查准率)为0.82,查准率比较高,但是recall(查全率)为0.59,命中率不够高,表示有一些实际是欺诈的客户模型没能识别出来,遗漏了。②stratify=y是一个重要的参数,当y是分类变量时,使用该参数可以确保划分后的训练集和测试集在不同类别上的比例与原始数据集的比例保持一致,这对于分类任务非常重要,避免某些类别在测试集中的比例失衡。

2025-01-19 23:18:12 1517

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之一维数组(应用技巧)

根据题意,首先将定义一个标记数组来记录树的起始状态,假设起始状态为1,接着输入马路的长度和区域数目,对于区域内出现的树修改标记,将标记从1修改为0,修改完成之后,依次遍历树的标记,记录标记发生变化的树之和,最后对和输出。输入共M+1行,第一行有两个整数L(1 <= L <= 10000)和 M(1 <= M <= 100),L代表马路的长度,M代表区域的数目,L和M之间用一个空格隔开。接下来的M行每行包含两个不同的整数,用一个空格隔开,表示一个区域的起始点和终止点的坐标。,L,都种有一棵树。

2025-01-18 23:33:17 346

原创 支持向量机算法(三):非线性支持向量原理层层拆解,精读公式每一处细节

比如,有两个玩具叫小熊和小兔子,你把它们的名字告诉魔法盒子(核函数),魔法盒子就会告诉你一个数字,这个数字就代表了如果把小熊和小兔子放到大仓库里,它们之间的一种亲密程度(在高维特征空间中的内积)。其中,c为可选的常数。作为高斯核函数的带宽,通过控制核函数的宽度,影响着样本之间的权重分配,进而对基于高斯核函数的机器学习模型的性能产生重要影响,需要谨慎选择和调整。线性核函数是多项式核函数的特殊情况(a=1,p=1),多项式核函数通过调整a、c和p的值,可以得到不同的核函数形式,具有更强的灵活性和适应性。

2025-01-18 23:19:50 1319

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之一维数组(应用技巧)

根据题意,刚开始盘子全部为白色,对盘子操作涂色,对于这一类问题采用打标记的思想,采用数组下标对应盘子的编号,数组元素的值表示颜色状态,即用数组a[i]表示编号为i盘子的涂色状态,a[i]=1(bool类型),表示涂了颜色(bool值为true),a[i]=0表示没有涂过颜色(bool值为 false),重复涂色的盘子最终状态依然为1。定义一个长度为105的整型数组a,将数组a中的每个字节都赋值为0,一个整数类型占4个字节,由于每个字节都是0,则一个整型数字的结果就为0。表示将数组中每个元素赋值为-1;

2025-01-17 21:03:57 1122

原创 云存储面面观:概念内涵与实现基础探究

云存储中的存储设备数量庞大且分布多在不同地域,如何实现不同厂商、不同型号甚至于不同类型(如FC(Fibre Channel)存储和IP存储)的多台设备之间的逻辑卷管理、存储虚拟化管理和多链路冗余管理将会是一个巨大的难题,这个问题得不到解决,存储设备就会是整个云存储系统的性能瓶颈,结构上也无法形成一个整体,而且还会带来后期容量和性能扩展难等问题。同时,它也是一种下载方式,在下载时,自己的电脑在下载的同时还要做主机上传,这种方式人越多下载速度越快,但缺点是对硬盘损伤较大,对内存占用也多,会影响整机速度。

2025-01-17 21:00:04 680

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之一维数组(应用二)

如果y−x>5%,则效果更好,如果 x−y>5%,则效果更差,否则称为效果差不多。输入共n+1行:第一行为一个整数n(1<n<=20),表示鸡尾酒疗法和新疗法的总个数;接下来的n行,每行包含两个整数,第一个整数是临床实验的总病例数(小于等于10000 ),第二个疗效有效的病例数,这n行数据中,第一行为鸡尾酒疗法的数据,其余各行为各种改进疗法的数据。根据题意,定义长度为n的最大值100的int类型数组来存储整数序列,然后输入整数序列的实际长度n,使用循环输入长度为n的整数并存储到数组中;

2025-01-16 16:56:11 938

原创 走进数据中心:了解定义、作用、分类,洞悉云计算大数据时代发展新趋势

如果是互联网公司,其数据中心就和普通企业和单位的数据中心不同,因为互联网的信息实在庞大,不可能将所有信息都存储到数据中心的数据库中,数据中心也处理不了那么多的信息,所以互联网环境下的数据中心的作用就是加强互联网数据的处理速度和效果。(1)规模化:数据中心建设规模不断扩大,超大型数据中心受青睐,我国超大型数据中心从2018年的34个增长到2021Q3的105个,三年复合增长率达45%,机架占比也从2018年的34%增长到2021Q3的41%,未来数据中心将朝全球化、国际化规模发展。如果是具体的企业或单位,

2025-01-16 16:31:40 1751

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之一维数组(应用一)

根据题意,首先考虑桃子的存储问题,由于涉及到的桃子数量多,所以使用刚学习的数组来解决此问题,数组的数据类型使用int类型,长度为10,定义好数组之后,使用循环来输入每个桃子的高度存储到数组元素中;小明家院子里有棵桃树,桃子成熟的时候,小明就会带着30厘米高的板凳跑去摘桃子,当他不能直接用手摘到桃子的时候,就会踩到板凳上再试试。桃树上每次都是10个桃子,现在已知桃子到地面的高度,以及小明把手伸直的时候能够达到的最大高度,请帮小明算一下他能够摘到的桃子的数目。输入n个整数,以0结束,反向输出。

2025-01-15 18:28:02 760

原创 六种主流虚拟化技术全解析:OpenStack、KVM、Hyper-V、VMware、Xen及Docker

Hyper-V采用基于VMBUS(Virtual Machine Bus)的高速内存总线架构,所有来自虚拟机的硬件请求,都可以直接经虚拟化服务客户机(Virtualization Service Consumer,VSC),通过VMBUS总线发送到根分区的虚拟化服务提供者(Virtualization Service Provider,VSP),VSP则调用对应的设备驱动直接访问硬件,中间不再需要通过Hypervisor的管理。因为虚拟机的特性,所以不管是什么类型的应用程序都是可以运行的。

2025-01-15 18:24:11 5600 1

原创 Python基础完整习题分析练习,适合入门

描述:获得用户输入的两个与时间相关的字符串,两个时间用逗号分隔,每个时间字符串格式示例如下:2018年08月01日17点21分21秒。请编写一个个人所税计算器,用户输入应发工资薪金所得、五险一金金额和个税免征额,输出应缴税款和实发工资,结果保留小数点后两位。描述:求斐波纳契(Fibonacci)数列:1, 1, 2, 3, 5, 8... 的前n项,n的值从键盘输入。其中:实发工资=应发工资-五险一金-应缴税款 ,要求使用下面的输入语句并补充代码。输出:"1,1,2,3,5,8,13,21,34,55"

2025-01-14 23:49:45 417

原创 计算机操作系统中进程的挂起操作和状态的转换

☛静止就绪(Readys):活动就绪时被 Suspend 挂起后, 此时它 不再接受进程调度,不再竞争 CPU 的使用权。当对某个进程进行挂起操作是,该进程将暂不接受调度,不能参与对 CPU 使用权的竞争,即处于相对静止的状态。本次因时间问题,快过年了,事情有点多,暂且学习这么多,后期接着学习关于操作系统进程的相关知识点。在引入挂起状态后,又将增加挂起状态(又称为静止状态)和非挂起状态(又称为活动状态)的相互转换。☛活动就绪(Readya):未被挂起的就绪状态。2. 引入挂起原语操作后三个进程状态的转换。

2025-01-14 23:34:09 328

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之一维数组

假设定义了一个长度为10的整数数组,即int a[10],对于int a[10],其中a是一维数组的数组名,该数组有10个元素,那么这10个元素依次表示为∶a[0],a[1],a[2]a[3],a[4]a[5],a[6]a[7],a[8],a[9];例如: int a[10]={0,1,2,3,4,5,6,7,8,9};经过上面的定义和初始化之后, a[0]=0, a[1]=1, a[2]=2, a[3]=3, a[4]=4, a[5]=5, a[6]=6,a[7]=7,a[8]=8,a[9]=9。

2025-01-13 21:54:44 768

原创 秒懂虚拟化(四):虚拟化技术优劣、技术原理、CPU虚拟化和内存虚拟化全解析,通俗解读版

为了减少迁移对用户的影响,企业需要在迁移前进行充分的规划和测试,制定详细的迁移方案,包括迁移时间窗口的选择、备用方案的制定等。例如,在某一时间段内,文学院的教学任务对计算资源需求较低,而工学院的科研项目需要大量计算资源,虚拟化平台会自动将文学院虚拟机占用的部分资源调配给工学院的虚拟机,从而提高了物理资源的整体使用率。在X86的体系框架中,CPU指令权限一般分为4种,ring0、1、2、3 权限为0的区域的指令一般只能内核可以运行,权限为3的指令则是普通用户运行,权限为1、2的区域一般由驱动所使用。

2025-01-13 21:43:48 1486

原创 秒懂虚拟化(三):桌面拟化、用户体验虚拟化、应用程序虚拟化全解析,通俗解读版

Wine 可以帮助实现这一目标,它可以将 Windows 游戏的安装文件进行解析,将游戏运行过程中对 Windows 系统的调用(如对 DirectX 的调用等)转换为 Linux 系统能够理解的方式。不过,Wine 的兼容性因应用程序而异,一些复杂的、对 Windows 系统有深度依赖的应用程序可能无法完美地在 Wine 环境中运行,但对于许多简单的 Windows 应用(如一些办公软件、小型工具软件等),Wine 提供了一个很好的在 Linux 系统上运行的解决方案。这取决于用户的技术方案选择。

2025-01-12 20:10:38 1591

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(应用)

正常血压的定义是:收缩压在90到140之间(包含90和140),舒张压在60到90之间(包含60和90),需要遍历所有的血压测量值,并检查每个连续的血压测量值是否都在正常范围内。为了满足上述条件,可以构建一个递增的整数序列,其中每个数字代表一个小朋友拿到的苹果数量,这个序列从1开始,因为最小的正整数是1,并且每个小朋友至少拿到一个苹果;输入共n+1行,第一行为一个正整数n(n<100),表示病人测量的血压次数,其后有n行,每行2个正整数,分别为一次测量的收缩压和舒张压。第2行:第10次弹跳的高度。

2025-01-12 19:06:39 920

原创 秒懂虚拟化(二):服务器虚拟化、操作系统虚拟化、服务虚拟化全解析,通俗解读版

每个隔离服务器具有相同的硬件环境(Same hardware)和相同的操作系统(same OS),并且可以运行各自的应用程序(Applications)。这种将各种服务虚拟化的方式,为用户提供了更灵活、便捷、高效的解决方案,用户可以根据自身业务需求,按需选择和使用相应的服务,而无需关心底层的技术实现和运维细节。服务器虚拟化,有时也称平台虚拟化,通过VMM(Virtual Machine Monitor,虚拟机监视器)提供虚拟的计算机硬件环境,我们将此虚拟的环境称之为VM(Virtual Machine)。

2025-01-11 21:27:26 1262

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(应用)

输入一个整数n,表示要计算的天数,观察到每个阶段的天数和每天收到的金币数是相等的,并且随着阶段的增加,天数和金币数都在递增;根据题意,定义变量sum 用于记录同时报出相同数的次数,报数是从1到1000,使用for循环来模拟报数过程,循环变量num的值从1到1000,同时用变量i 和 j 分别用于跟踪小明和小鹏当前的报数值(在各自的周期内),i和j的起始值都为1,在每次循环中,判断如果 i 达到21(即小明的周期结束),则将其重置为1,开始新的周期;输出一行一个整数,表示骑士获得的金币数。

2025-01-11 20:44:19 1023

原创 支持向量机算法(二):层层拆解,精读公式每一处细节

但是玩这个游戏是有规则的。这个打分机器有两部分,一部分是和方案的 “规模”(用变量表示)的平方有关的,就像你做一件事,做得越多或者越大,这部分的分数就会按照平方的关系变化;线性可分支持向量机只能处理线性可分问题,但实际应用中往往均是非线性问题,很难找到一条直线将两个样本完全分开,这时只能通过其他非线性模型或特征升维等技巧得到一个非线性的超平面,但这种在训练集上的优异表现可能会导致过拟合的结果,从而降低模型的泛化能力。:这是对松弛变量的约束,确保松弛变量是非负的,因为它们表示的是距离的调整量,不能为负数。

2025-01-10 23:21:45 1027

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(while循环应用)

对于任意两个正整数a和b,它们的最小公倍数LCM(a, b)与最大公约数GCD(a, b)的乘积等于a和b的乘积,即:LCM(a, b) * GCD(a, b) = a * b,由此,我们可以推导出计算最小公倍数的一个简便公式:LCM(a, b) = (a * b) / GCD(a, b),具体实现步骤为:首先输入两个正整数a和b;对于任意两个正整数a和b,如果存在一个正整数d,使得d能够同时整除a和b,即存在整数m和n,使得a = md且b = nd,那么我们就说d是a和b的一个公约数。

2025-01-10 18:48:15 1111

原创 秒懂虚拟化(一):从概念到网络、存储虚拟化全解析,通俗解读版

在一台计算机上同时运行多个逻辑计算机,每个逻辑计算机可运行不同的操作系统,并且应用程序都可以在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。在计算机中,存储虚拟化则是将所有的物理存储设备(硬盘、U盘、磁带等)整合到一起结成一个大的存储池,而提供给计算机系统的则是一个逻辑层面的接口。存储虚拟化,即整合所有存储资源为一个存储池,对外提供逻辑存储接口,用户通过逻辑接口进行数据的读写。☛DBaaS:是云计算中提供数据库管理服务的模式,用户通过网络使用数据库,云服务商负责管理,如亚马逊RDS。

2025-01-09 23:27:31 1041

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(while循环应用)

根据题意,假设输入变量为n,要构建反转后的数字rn,可以借鉴数位分离的思想,使用循环来逐位提取输入整数的每一位数字,通过取模运算 % 10 得到当前最低位的数字,将反转后的数字rn乘以10加上最低位为rn重新赋值,这样就可以得到到目前为止所有最低位数得到的反转数字rn,例如123,起始值rn为0,分离最低位数3之后,得到反转后数为3,再通过整除运算 /= 10 去掉当前最低位的数字,为下一次迭代准备,例如123变为12,紧接着在分离出2,rn=3*10+2=32,依次进行下去;团 队总数不超过10000。

2025-01-09 23:07:17 779

原创 Numpy数组的属性

需要注意的是,shape属性的值是一个元组,元组里面有多少个元素取决于数组的维度。描述数组中元素类型的对象,既可以使用标准的Python类型创建或指定,也可以使用NumPy特有的数据类型来指定,比如numpy.int32、numpy.float64等。表中罗列的属性比较抽象,不容易理解,为了让大家理解ndarray对象的属性,下面通 过画图的方式分别介绍一维数组、二维数组和三维数组的属性,具体如下图所示。Numpy的矢量运算能力是指它能够对数组中的每个元素执行相同的操作,而不需要编写循环。

2025-01-08 22:38:59 361

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(while循环应用)

在得到个位数字并输出后,为了继续分离下一位数字,需要将 n 更新为去掉当前个位数字的新数字,这可以通过整除运算来实现,例如对于数字 123,在输出 3 后,将 n 更新为 123 / 10,结果是 12,这样就可以继续分离下一位数字。当n=12 时,写下1,2,3,4,5,6,7,8,9,10,11,12。比如给定范围 [2,22],数字 2在数2中出现了1次,在数12中出现1次,在数 20 中出现1次,在数21 中出现1次,在数 22中出现2次,所以数字2在该范围内一共出现了6次。输入一行一个整数n。

2025-01-08 22:32:34 928

原创 支持向量机算法(一):像讲故事一样讲明白它的原理及实现奥秘

(Linear Support Vector Machine In Linearly Separable Case),有一些苹果和橙子,把它们的大小、颜色深浅当作特征,在二维平面上,能找到一条直线将苹果和橙子完全分开,每个水果都能精准归类,这就是线性可分,这条直线就是分类超平面,此为硬间隔最大化,这便是线性可分支持向量机的作用。由于新增了样本数据,相对于直线b而言,直线a与c对样本变化的适应性变差,使用直线a进行分类,标记的圆形点会被分到三角形中,使用直线c进行分类,标记的三角形点会被分到圆形中。

2025-01-07 21:32:42 704

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(for、while、do-while比较)

循环变量条件表达式在每次循环迭代前检查,如果为真,则执行循环体,否则退出循环;条件表达式在每次循环迭代前检查;由于do-while循环至少执行一次循环体,因此在使用时需要特别小心,确保循环条件最终能够变为假,以避免无限循环。循环变量更新部分通常放在循环体内,但也可以放在循环体外(如果逻辑上允许的话),然而这通常不是一个好的做法,因为它可能会使代码更难理解和维护。对于该代码如果循环体中没有提前结束循环break语句,那么此代码就是无限循环,即死循环,所有在省略表达式时,一定要注意避免出现此情况。

2025-01-07 19:47:21 709

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(do-while循环语句)

然后进行条件判断:检查number的值,如果number小于或等于0,循环继续,回到循环体的开始,再次输出提示信息并等待用户输入,如果number大于0,条件判断为假,跳出do-while循环;采用do-while实现,从n = 1开始累加每一项1/n到Sn,每次循环中,检查当前的Sn是否大于K,如果Sn大于K,则退出循环,此时的n即为所求的最小值,如果Sn不大于K,则继续累加下一项。如果用户第二次输入的是3,则程序会跳出do-while循环,并输出"您输入的正整数是: 3",然后程序结束。

2025-01-06 22:48:44 904

原创 从数据到诊断:朴素贝叶斯算法助力肿瘤预测之路

将score打印输出,结果为0.9824,也就是说,模型对整个测试集的预测准确度为0.9824,对于分类模型,不仅要关心整体的预测准确度,也要关心模型在每一类样本里面的表现 ,可以看到,对于恶性肿瘤的预测,模型的 precision(精准率)=0.99和recall(命中率)=0.99都比较高,因此,模型对于预测肿瘤性质的效果还不错。数据集中变量的详细描述如下表所示,表格中的“肿瘤性质”列为目标变量,剩下的字段为特征变量,目前只选取了6个特征变量,在医疗行业中实际用于判断肿瘤性质的特征变量要多得多。

2025-01-06 22:43:40 1090

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(while循环语句)

对于任意一个输入的正整数,按照奇偶性的不同做不同的处理,然后重读执行这一过程,直到结果为1,到底需要循环多少次,没有一个确定的值来表示次数,只需要判断结束的条件(结果不是1),循环就要继续执行下去,所以使用while循环来解决此问题;前面介绍了for循环相关内容,对于for循环来讲,可以明确循环变量的初始值和终值,即可以确定循环的次数,对于循环次数不确定的情况,可以使用while循环来解决,while循环作为最基本的循环结构之一,允许代码在满足特定条件时重复执行。当i大于10时,循环终止,程序输出总和。

2025-01-05 22:25:33 764

原创 一文讲明白朴素贝叶斯算法及其计算公式(入门普及)

这时候我们想知道这个有这些特点的水果它属于哪个类别,比如它是苹果、还是香蕉或者橙子,那就要去求在已经知道它有这些特点(也就是已知X的条件下),它属于某个类别Y的概率,这个概率就是后验概率P(Y|X)。“今天是下雨天”就是那个已经发生的事件B,“路上堵车” 就是事件A,我们想求的就是P(A|B)。条件概率是“贝叶斯公式”的关键所在,它也被称为“似然概率”, 一般是通过历史数据统计得到.贝叶斯公式可以预测事件发生的概率,两个本来相互独立的事件A和B,发生了某种“相关性”,此时就可以通过“贝叶斯公式”实现预测。

2025-01-05 22:19:26 1128

原创 全国青少年信息学奥林匹克竞赛(信奥赛)备考实战之循环结构(for循环语句)—(十)(求解数学中特殊的数)

根据题意,对于正整数n需要计算其所有正因子(不包括它本身)的和,借鉴求素数的思想,从1开始到n-1结束依次去整除n,使用循环来实现,循环变量i初始值为1,终值为n-1,更新表达式为自增运算,循环体内循环变量依次去整除n,如果n%i==0,那么将i累加到因子和,最后判断因子和是否等于它本身,等于则这个数是完全数,小于则为不足数,否则为过剩数。输出一行,如果n是完全数,则输出"Perfect",不足数则输出"Deficient",过剩数则输出"Abundant"。输入一行,两个整数m和n,且m<=n。

2025-01-04 19:42:42 504

基于Python的决策树用于员工离职预测(数据+代码)

基于Python的决策树用于员工离职预测(数据+代码)

2025-01-04

基于Python的决策树用于员工离职预测(数据+代码)

基于Python的决策树用于员工离职预测(数据+代码)

2025-01-01

Python知识点总结及答案(习题有解析)

稀缺资源,Python知识点总结及答案(习题有解析)

2024-12-20

Python详细入门(71页)

Python详细入门(71页)

2024-12-20

Python详细笔记(182页)

Python详细笔记(182页)

2024-12-20

Python经典题库及答案(67页)

Python经典题库及答案(67页)

2024-12-20

Python编程基础及高级特性的笔记整理

内容概要:本文档详细介绍了 Python 语言的基础特性和部分高级应用。涵盖了 Python 的实现、数据结构、控制流语句、函数定义与调用、异常处理、文件操作等多个方面的内容。特别强调了面向对象编程的特点及其与面向过程编程的不同,还提供了具体的实例练习,如冒泡排序和简单的扑克牌游戏等。 适用人群:适用于初学者至中级水平的 Python 开发者。 使用场景及目标:帮助学习者深入理解 Python 编程的核心概念和技术细节,能够灵活运用 Python 完成日常的编程任务或构建小型应用程序。 其他说明:文档内容全面,既包括理论讲解,又有实际操作练习,是学习 Python 不可多得的学习资料。建议边阅读边动手实践,以达到更好的学习效果。

2024-12-20

Python基础知识点复习整理:变量、数据类型、列表与字典详解

内容概要:本文详细整理了 Python 的基础知识点,涵盖变量及其类型、数据结构(列表、元组、集合、字典)的创建、操作与方法。特别强调了列表的多种操作方法(如切片、累加、排序等),以及字典的各种应用(包括创建、更新、删除键值等)。同时也介绍了简单的字符串处理和文件操作,包括文件的打开、读取、写入等。 适合人群:适用于刚开始学习 Python 的初学者或希望快速复习 Python 基础知识的开发者。 使用场景及目标:① 对 Python 基础知识进行全面梳理;② 提升对数据结构(如列表、字典等)的操作能力;③ 掌握简单的字符串处理和文件操作技巧。 阅读建议:结合具体的代码实例来加深理解,尤其是数据结构部分的操作,可以尝试自己动手练习,加强对知识点的记忆。

2024-12-20

计算机组成原理教案全(带目录58页)

计算机组成原理教案全(带目录58页)

2024-12-20

计算机图形学教案(33页全)

计算机图形学教案(33页全)

2024-12-20

计算机基本结构教案(可参考)

计算机基本结构教案,可参考

2024-12-20

《计算机操作系统》知识点总结17页

《计算机操作系统》知识点总结【17页】

2024-12-16

《计算机操作系统》第4版汤子瀛知识点整理23页

《计算机操作系统》第4版汤子瀛知识点整理【23页】

2024-12-16

Windows内部专用硬盘检测工具(不足10M)

可全面检测硬盘情况,查看磁盘占用,整理硬盘,不足10M,内部使用软件

2024-12-14

Win11专项优化软件(可轻松设置、去除快捷方式、跳过重启)

Win11专项优化软件(可轻松设置、去除快捷方式、跳过重启)

2024-12-14

操作系统课程设计任务书

操作系统课程设计任务书,适用于大学计算机类专业学生

2024-12-12

VB+ACCESS电脑租赁系统设计(源代码+系统)

VB+ACCESS电脑租赁系统设计(源代码+系统)

2024-12-12

大学Python基础考试题库100道,含答案

大学计算机专业Python题库,可用于期末考试练习

2024-12-11

CMake 入门实战的源代码

CMake 入门实战的源代码,全部8个demo的实例代码。

2024-11-22

采用MVC、SSH框架开发的汽车销售管理系统,可用于毕业设计

系统的软件环境配置为Windows 7操作系统,SQL Server 2005数据库, MyEclipse8.5集成开发环境。采用MyEclipse8.5集成开发环境,SQL Server 2005数据库,MVC框架和SSH框架。涉及前后台系统,主要功能如下: (1)系统前台基本功能设计与实现: 用户维护模块设计与实现; 汽车展示模块设计与实现; 购物车模块的设计与实现; (2)系统后台管理功能设计与实现; 基本信息管理设计与实现;其他模块的实现原理。

2024-01-28

《Django实战》源码(第一、第二版) .zip

《Django实战》源码(第一、第二版)源码,亲测可正常运行

2019-06-03

《微信公众平台与小程序开发》书籍源码.zip

使用PHP语言进行开发的《微信公众平台与小程序开发》书籍源码,亲测可以使用

2019-06-10

Photoshop cc 2019 正版优化版【免密码安装】

Adobe Photoshop CC 2019简称PS CC 2019,它是目前最专业的图像处理软件。adobe官网已经提供Photoshop CC 2019(版本号20.0.0)中文版下载。目前小编基于官方发布的正版软件进行了优化,可以终身免费试用正版PS2019的全部功能,由于软件较大,超出上传限制,现将软件放至百度网盘中,现将链接放到CSDN文件中。

2019-05-03

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除