![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 72
Hole_up
数据科学与大数据技术
展开
-
【2024_CUMCM】机器学习导论、不平衡分类模型(重采样)、交叉验证(附代码)
这种举例子就懂了,例如根据体检数据判断是否患病,那根据常识,不患病的人肯定说远多于患病人数;例如检测欺诈性信用卡交易。如下图所示,欺诈性交易约为400笔,而非欺诈性交易为约90000笔。如果对于这种不平衡模型之间进行训练,你会发现调到最后,预测出不患病的准确率接近百分百,预测患病的准确率为0,这显然是不行的通过重采样进行解决用于处理高度不平衡数据集的一种广泛采用的类不平衡技术称为重采样。它包括从多数类中删除样本(欠采样)和/或从少数类中添加更多样本(过采样。原创 2024-07-11 11:47:15 · 762 阅读 · 0 评论 -
【Python】易错点2——异常处理
我们在程序开发的时候,很难将所有的特殊情况都处理,通过异常捕获可以针对突发事件做集中处理,从而保证程序的健壮性和稳定性。程序在运行的时候,如果python解释器遇到一个错误,会停止程序的执行,并且提示一些错误的信息,这就是异常。如果你不知道可能会出现哪种异常,有二种方案,一是把所有可能的罗列出来,另一种是使用万能异常。在程序开发中,如果对某些代码的执行不能确定(程序语法完全正确)可以增加try来捕获异常。当捕获到异常时,程序将打印出错误消息,并继续执行后续的代码。在主程序中,将10除以0,这将触发。原创 2024-06-08 09:56:59 · 504 阅读 · 0 评论 -
【Python】易错点1
不可变数据类型: 当该数据类型的对应变量的值发生了改变,那么它对应的内存地址也会发生改变,对于这种数据类型,就称不可变数据类型。可变数据类型 :当该数据类型的对应变量的值发生了改变,那么它对应的内存地址不发生改变,对于这种数据类型,就称可变数据类型。原创 2024-06-08 09:24:56 · 591 阅读 · 0 评论 -
【Python】易错点3——最大公约数
【代码】【Python】易错点3——最大公约数。 辗转相除法 辗转相减法 穷举法原创 2024-06-08 11:12:30 · 216 阅读 · 0 评论 -
【Python】练习:分糖果Ⅱ
读题,发糖规则为逐个递增分发,发现分发的糖果成等差数列,最后的(不够继续分的)需特殊讨论。对于最后剩下的不能完整分发的,把他加给最后一个人,即第(col+1)个人,即d[col]后面如果是能在完整回合分发结束时,即首项为i+1,公差为n(人),总共有row项。注意,计算到p(p+1)时,通过把不等式拆成两个不等式解出p的范围。C表示总糖数,p(1+p)/2表示前 p项和,相减得到剩余糖数。定义列表,后面采取列表的替换,初始定义为0,有n个元素。出现新的问题,怎么知道有多少完整的轮次——row?原创 2024-06-06 22:54:45 · 342 阅读 · 0 评论 -
【Python】编写一个程序,实现二维列表的转置;列表推导式
【Python】编写一个程序,实现二维列表的转置,利用for循环嵌套和列表推导式的方法;复习列表推导式,介绍基本语法,对比两种,以及介绍复杂的列表表达式原创 2024-05-24 18:22:02 · 500 阅读 · 1 评论 -
【2024_CUMCM】时间序列算法ARMA
ARMA模型,全称为自回归移动平均模型(Autoregressive Integrated Moving Average Model),是一种常用于时间序列分析的统计模型。它结合了自回归模型(AR)和移动平均模型(MA)的特性,能够描述时间序列数据中的自相关性和随机扰动之间的关系。ARMA模型通常表示为ARMA(p, q)形式,其中p表示自回归项的数量,q表示移动平均项的数量。原创 2024-07-07 22:00:34 · 837 阅读 · 0 评论 -
NLTK下载及其报错问题,包解决
所以就开始想办法解决,最开始以为是找不到wordnet包,所以就先手动下载WordNet,然后把dowload改为相对地址了,但是发现问题并没有解决,还是用不了,所以就看了官网。NLTK一般是在作自然语言处理时用到,最开始时,我是直接在conda进行`conda install nltk`进行安装,以为就可以直接使用,但是运行时总会出现以下情况。对于window系统,host路径为`C:\Windows\System32\drivers\etc`,直接访问,然后使用记事本或者BowPad进行修改。原创 2024-07-05 17:03:00 · 526 阅读 · 0 评论 -
【Python】(一)复习——面向对象
类(Class):用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。定义在方法中的变量,只作用于当前实例的类。在类的声明中,属性是用变量来表示的。这种变量就称为实例变量,是在类声明的内部但是在类的其他成员方法之外声明的。即一个派生类(derived class)继承基类(base class)的字段和方法。继承也允许把一个派生类的对象作为一个基类对象对待。原创 2024-06-12 09:00:00 · 264 阅读 · 0 评论 -
【Python】(一)复习重点——控制流
按顺序。这类结构最直观,我们前面接触到的程序都是一行一行代码从头到尾执行,这是语言默认地、也是最简单的控制结构。原创 2024-06-11 22:46:50 · 204 阅读 · 0 评论 -
【Python】推导式
Python 推导式是一种强大的编程技巧,允许你以简洁的方式创建列表、字典、集合和元组。它们不仅能够减少代码量,还能提高代码的可读性和效率。原创 2024-05-28 09:24:28 · 278 阅读 · 0 评论 -
【Python】(一)复习重点——类型;结构
元组(tuple)与列表类似,不同之处在于元组的元素不能修改。a, b, c = 1, 2, "runoob" # 多个对象指定多个变量。{'b', 'c', 'a', 'r', 'd'} ——集合元素不重复。列表是有序的对象集合,字典是无序的对象集合。{'r', 'b', 'd'} ——在a里面,但不在b里面。字典是一种映射类型,字典用 { } 标识,它是一个无序的。{'c', 'a'} ——a,b的公共部分。3->步长为-1,表示逆向,每步为1。的数据类型,用于存储唯一的元素。原创 2024-06-11 09:20:54 · 790 阅读 · 0 评论