自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 numpy TASK5 排序搜索和计数

TASK5 排序搜索和计数5.1 排序5.1.1 numpy.sort()5.1.2 numpy.argsort()5.2 搜索5.2.1 numpy.argmax()5.2.2 numpy.argmin()5.2.3 numppy.nonzero()5.2.4 numpy.where()5.2.5 numpy.searchsorted()5.3 计数5.3.1 numpy.count_nonzero()5.4 集合5.4.1 numpy.unique()5.4.2 numpy.intersectld()5

2020-10-31 19:31:11 164

原创 numpy TASK4函数

numpy数学函数和逻辑函数4.1 向量化和广播4.2 数学函数4.3 三角函数4.4 指数和对数函数4.5 加法和乘法函数4.6 四舍五入4.7逻辑判断4.1 向量化和广播向量化和广播这两个概念是 numpy 内部实现的基础。有了向量化,编写代码时无需使用显式循环。这些循环实际上不能省略,只不过是在内部实现,被代码中的其他结构代替。向量化的应用使得代码更简洁,可读性更强,也可以说使用了向量化方法的代码看上去更“Pythonic”。广播(Broadcasting)机制描述了 numpy 如何在算术运算

2020-10-28 20:40:38 131

原创 numpy TASK3 数组的操作(变形)

numpy.ndarray.shape 表示数组的维度,返回一个元组,这个元组的长度就是维度的数目,即 ndim 属性(秩)。numpy.ndarray.flat 将数组转换为一维的迭代器,可以用for访问数组每一个元素。numpy.ndarray.flatten([order=‘C’]) 将数组的副本转换为一维数组,并返回。注意两者的区别,返回的性质不同!y = np.ravel(x)ravel() 返回的是视图。reshape() 函数当参数newshape = [rows,-1] 时,将根据行

2020-10-25 20:32:02 119 1

原创 numpy学习 TASK2

1 常量1.1 numpy.nannumpy.nan 表示的是空值,两个numpy.nan是不相等的.而不相等的原因是numpy中的nan意为 not a number,表示的是一个不确定的数,所以两个不确定的数不可能比较大小。import numpy as npprint(np.nan==np.nan)print(np.nan!=np.nan)FalseTruenumpy.isnan() 测试元素是否是空值,并将结果作为布尔数组返回。import numpy as np x=np

2020-10-23 21:18:55 107

原创 Numpy学习 TASK1

TASK1 数据类型及数组创建1 数据类型1.1 常见数据类型1.2 创建数据类型1.3 数据类型信息2 数组创建2.1依据现有数据创建ndarray2.1.1 array() 函数2.1.2 asarray() 函数2.1.3 fromfunction() 函数2.2 依据ones 和zeros 填充2.3 依据数值范围创建2.4 结构数据的创建2.4.1 利用字典定义结构2.4.2 利用包含多个元组的列表来定义结构NumPy(Numerical Python) 是 Python 语言的一个扩展程序库

2020-10-20 19:49:35 217

原创 金融风控TASK5

金融风控TASK5:模型融合5.1 平均法5.1.1 简单平均5.1.2 加权平均法5.2投票5.3 综合法5.4 stacking5.5 blending5.6 代码示例模型融合是指将一组不同的模型以合适的方法组合在一起,进而能够让组合模型获得更好的表现。5.1 平均法对于一个回归问题而言,假如存在三种不同的模型,各自有着不同的预测结果。一种朴素的思路是将折三个不同的模型的进行简单平均,得到一个新的预测值。进一步,可以尝试调整各个模型的的权重来获得不同的线性组合。将不同模型通过线性组合的方式组合

2020-09-27 19:55:35 165

原创 小白金融风控TASK4

小白金融风控TASK4 :建模调参4.1模型原理介绍4.1.1 逻辑回归模型4.1.2 树模型4.1.3 集成模型4.2 模型对比与性能评估4.2.1 逻辑回归4.2.2 决策树4.2.3 集成模型4.2.4 模型评估方法4.4.5 模型评价标准4.3 建模调参4.1模型原理介绍4.1.1 逻辑回归模型逻辑回归是分类机器学习算法,它将数据拟合到一个logit函数(或者叫做logistic函数)中,从而能够完成对事件发生的概率进行预测。逻辑回归的本质是为解决线性回归的预测结果是一个连续值而存在的,它

2020-09-23 21:31:58 120

原创 小白金融风控TASK3

小白金融风控TASK033.1数据预处理3.1.1 导入包并读取数据3.2异常值处理3.2.1 特征预处理3.2.2 缺失值填充3.2.3时间格式处理3.2.4 纯类别型特征处理3.2.5 异常处理3.3 数据分箱3.4 特征交互3.5 特征编码3.6 特征选择此部分是金融风控的特征工程部分,要实现的目标是:学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法学习特征交互、编码、选择的相应方法3.1数据预处理3.1.1 导入包并读取数据导入需要的包,查找出数据中的对象特征和数值特征

2020-09-21 22:04:33 165

原创 小白金融风控TASK2

TASK2 数据分析此部分为数据集的探索性分析部分,包括了解数据的总体分布,缺失值处理和异常值处理,明确变量间的相互关系、变量和预测值之间的关系,同时也为接下来特征工程做好准备工作。2.1 数据的总体了解2.1.1导入数据并读取数据// An highlighted block# -*- coding: utf-8 -*-import pandas as pdimport numpy as npfrom pandas import Series,DataFrameimport seabor

2020-09-18 11:18:09 131

原创 小白金融风控TASK1

小白金融风控(贷款预测)Task1 赛题理解1.1学习目标1.2赛题情况1.3数据情况1.4预测指标1.4.1 常见分类算法评估指标1.4.2 金融风控预测类常见的评估指标1.5 赛题流程1.6 代码样例1.6.1读取数据1.6.2 简单查看数据Task1 赛题理解赛事背景:本次新人赛是Datawhale与天池联合发起的0基础入门系列赛事第四场 —— 零基础入门金融风控之贷款违约预测挑战赛。赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷

2020-09-15 17:05:24 156 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除