自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 决策树—CART分类树,CART回归树快速理解

在每次迭代中,CART选择最优的特征及其取值来分割数据,以使得生成的子集中的数据尽可能“纯净”,即属于同一类别或具有相似的目标变量值。在构建树的过程中,可以通过适当的策略(如将缺失值视为一个特殊的类别或根据其他特征的值进行估计)来处理缺失值。根据输入的特征,通过决策树的判定条件逐步判断,直到确定所属的类别或预测的值。建立决策树:根据划分的结果,递归地构建决策树,直到每个子集中的数据都属于同一类别,或者达到预定义的停止条件。:与分类树不同,回归树预测的是连续型的数值,而不是类别标签。

2024-05-18 15:05:42 628

原创 决策树—ID3树,C4.5树快速理解

同时,C4.5能够处理连续属性和缺失值,并通过剪枝策略来提高模型的泛化能力。具体来说,将新的数据从根节点开始,根据每个内部节点的特征属性取值进行路径选择,最终到达一个叶子节点,该叶子节点所表示的类别即为预测结果。具体来说,将新的数据从根节点开始,根据每个内部节点的特征属性取值进行路径选择,最终到达一个叶子节点,该叶子节点所表示的类别即为预测结果。3,处理连续属性:如果当前节点的划分特征是连续属性,C4.5会采用二分法进行处理,选择一个阈值将数据集分为两个子集,然后选择信息增益率最大的阈值进行划分。

2024-05-13 15:35:19 1440 1

原创 Mysql—窗口函数(聚合函数,排序函数等等)

(2)first_value()和last_value()函数是从一组记录中分别获取该组内的第一个值和最后一个值。结果为:路飞的前一行成绩没有数据显示null,乔巴的下一行没有成绩数据显示null。(1)lag()和lead()函数分别表示显示前一行数据和后一行数据。结合sum(),count(),max(),min(),avg()

2024-04-27 22:13:37 457

原创 Pandas—DataFrame对象创建、常用属性、方法、运算、布尔类型、排序等等详解

df.groupby(['分组列1', '分组列2'...]).agg({'列名':'聚合函数名', '列名':'聚合函数名'})df.groupby(['分组列1','分组列2'...])[[要进行聚合的列1, 列2...]].聚合函数()df1.insert(loc=1,column='gender',value='女')df1.index=['A','b','c','d']'name':['温蒂','纳兹','露西','格雷'],'name':['温蒂','纳兹','露西','格雷'],

2024-04-22 21:53:55 1010

原创 Pandas—Series对象:常用属性、方法、布尔类型、运算快速理解

print(data_df.iloc[0]),行号就相当于每行数据的索引值,第一行数据的索引值为0。print(s2.sort_index(ascending=True)) 效果同上.传入列表和元组的时候里面可以指定索引列格式为index=['a','b','c']第一列为原来的列名,第二列为对应的一行数据,并会打印行索引值以及行索引值的类型。或df1.age[df1.age > df1.age.mean()]'name':['温蒂','纳兹','露西','格雷'],

2024-04-22 21:44:03 1548

原创 Python—闭包和装饰器快速简单理解

装饰器就是在不改变原有函数的基础上,给原有函数增加额外功能。再介绍一个常用的使用方法就是在你要增加额外功能的函数上面,写上额外功能的外部函数名(也就是闭包函数的外部函数名)。如果这样的简单代码能看懂的话,装饰那些有参有返回,有参无返回等函数也就能看懂了哦,希望能够帮到你呀!闭包的作用是可以保存函数内部的变量,它不会随着调用完函数之后被销毁。把使用了外部函数变量的内部函数 称为闭包。是指有函数套函数的结构,即有外函数和内函数。是指内部函数要用到外部的函数定义的变量。有嵌套,有引用,有返回。

2024-04-20 21:23:57 413

原创 Numpy—详细教程,创建数组,数组属性,内置函数及运算

例如:a=np.zeros((2,2),dtype=np.float64)np.zeros((2,2)) 结果为[[0 0] [0 0]]3,4')结果为[[1 2][3 4]]np.ones((2,2)) 结果为[[1 1] [1 1]]承上例arr3,print(np.all(arr3 > 0))np.array([2,3,4]),其中np为包的别名。承例b,np.where(b > 0, 1, -1)承上例a,b=a.astype(np.int32)承例b,print(np.multiply(b))

2024-04-20 11:17:10 632

原创 Python—正则表达式详细讲解

正则表达式全称是 Regular Expression, 是用来校验和匹配数据,下面就来教你怎么看懂别人所写的正则表达式。

2024-04-19 17:06:55 469

原创 Python——快速理解面向对象及三大特性

其中def__init__(self)是初始化属性的时候要写的,里面的self是对象本身,类内添加属性的方式是self.属性名=属性值的方式,类外进行属性的添加的话就是对象名.属性名=属性值的方式。多态指的是:多种状态。多态的条件首先得有继承 (定义父类、定义子类,子类继承父类),然后就是函数重写 (子类重写父类的函数),最后是父类引用指向子类对象 (子类对象传给父类对象调用者)。好比在饭店吃饭,要解决的问题是吃饭,但我没有自己去买菜做饭,而是把这一系列繁琐的操作过程交给饭店的厨师,就吃厨师做好的饭就行。

2024-04-18 20:48:47 373

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除