自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 机器学习基本流程

我们做特征工程的最终目标是模型表现要超过基线模型,目的是挑选/构造出区分度好和目标相关性强/ 对目标值的区分能力比较强的特征。f1_score 2 精准率 * 召回率/ 精准率 + 召回率。AUC指标 取值范围 0.5 ~ 1。使用模型:KNN,线性回归,逻辑回归,决策树,朴素叶贝斯等等。创建对象, 使用训练集fit 测试集predict。精准率 TP/TP+FP。召回率 TP/TP+FN。特征的系数:df.corr()超参数搜索 交叉验证网格搜索。空值,异常值,缺失值的处理。MAE 绝对平均误差。

2024-01-14 19:19:54 636 1

原创 Pandas中的数据组合与分组

join():只能做横向链接,根据索引进行连接,默认是左外连接。append():只拼接一个。

2023-12-24 20:37:14 142

原创 Numpy与Pandas

我们读取到的数据是一个DF(DataFrame)对象,可以换取单行单列(Series对象)的数据进行详细的数据分析。还可以使用array随机函数生成,与python中的range类似。使用matrix()函数:数据使用空格或逗号隔开,数组与数组之间使用分号隔开。分别将行名和列名存入两个字典中,然后使用rename函数进行更改。也可以使用列表,先读取列名和行名用列表存储,更改,在重新赋值回去。Pandas:分为Series对象和DataFrame对象。也可以随机生成数据:random。

2023-12-23 15:49:07 145 1

原创 Python中的闭包与装饰器

闭包函数需满足三个条件:有嵌套,有引用(在内部函数使用了外部函数的变量),有返回(外部函数中返回了内部函数)装饰器:是一个闭包函数,同时满足要有新加的功能,并且内置函数与原函数格式保持一致。使用闭包函数的目的:保存函数内的变量,而不会随着函数调用完而被摧毁。装饰器的产生是为了不改变原有的函数,而给这个函数添加新的功能。noolocal :在内部函数中使用,更改外部函数的变量。global :在函数中使用,更改全局变量。关于闭包:使用了外部函数变量的内部函数。关于装饰器:实际上就是一个闭包函数。

2023-12-20 14:17:32 236

原创 Python中的多进程与多线程

子进程对象 = multiprocessing.Process(target=任务名,args/kwargs=要传递的参数)2. 通过进程类 实例化进程对象 子进程对象 = multiprocessing.Process(target=任务名)线程对象 = threading.Thread(target=任务名,args/kwargs=要传递的参数)2. 通过线程类创建线程对象 :线程对象 = threading.Thread(target=任务名)3. 启动线程执行任务:线程对象.start()

2023-12-13 12:05:12 202 1

原创 Python中关于*和**的使用

对于**,变量为字典,将其拆解出来,单独传给函数。可以解包列表,元组,集合,可以在调用函数时使用。在函数中*和**都可以作为形参和实参传递。**接受关键字参数,返回类型为字典。作为形参时:可以接受不定长参数。*接受位置参数,返回类型为元组。*放在列表前返回其中的元素。*和**可以一起作为形参使用。字典的键与函数的参数要一致。

2023-12-10 15:48:06 24

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除