自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (4)
  • 收藏
  • 关注

原创 python库的一些处理

先python后输入,查看包的安装目录。删除所有的python库。安装所有的python库。清华源指定版本安装库。

2023-11-01 10:51:56 107

原创 逻辑回归中对L1\L2正则化的理解

在逻辑回归中,L1和L2正则化是常用的正则化技术,用于控制模型的复杂度并防止过拟合。它们通过在损失函数中引入额外的正则化项来实现。

2023-09-18 11:05:07 793

原创 Transformer最直观的解析(译)

解码器堆栈输出一个浮点数向量。我们怎么把它变成一个词?这是最后一个线性层的工作,然后是一个Softmax层。线性层是一个简单的全连接神经网络,它将解码器堆栈产生的向量投影成一个更大的向量,称为logits向量。让我们假设我们的模型知道从训练数据集中学习到的10,000个唯一的英语单词(我们模型的“输出词汇”)。这将使logits向量宽为10,000个单元格——每个单元格对应一个唯一单词的分数。这就是我们如何解释线性层之后的模型输出。

2023-09-14 16:08:41 170

原创 FM模型的例子

【代码】FM模型的例子。

2023-09-13 10:16:24 139

原创 pytorch中使用embedding层的示例

【代码】pytorch中使用embedding层的示例。

2023-09-07 14:11:21 240

原创 使用dataframe基于pytorch训练神经网络模型的例子

【代码】使用dataframe基于pytorch训练神经网络模型的例子。

2023-09-07 11:01:17 215

原创 groupby后对数据的聚合处理方法汇总

优势:简单便捷对B列计数,C列求和,列名称分别为B。

2023-08-17 17:48:01 465

原创 XGBOOST自定义损失函数

import osseed = 1# 加载数据集# 划分训练集和测试集# 转换数据格式为DMatrix# 设置模型参数params = {'objective': 'binary:logistic', # 二分类逻辑回归'eval_metric': 'error', # 评估指标为错误率# 训练模型num_rounds = 100 # 迭代次数# 预测y_pred_binary = [1 if p > 0.1 else 0 for p in y_pred] # 将概率转换为类别。

2023-08-16 15:55:12 428

原创 Glove的一个小例子

【代码】Glove的一个小例子。

2023-08-15 13:58:54 37

原创 自编码器的介绍

【代码】自编码器的例子。

2023-08-11 15:20:29 417

原创 风控建模常用指标

KS常用于评估模型区分度,区分度越大,说明模型的风险排序能力越强。

2023-08-10 13:56:04 1015

原创 使用python快速上手MongoDB

find():find()方法用于从集合中检索文档。它接受一个查询条件参数,并返回满足条件的所有文档。findOne():findOne()方法用于检索集合中满足条件的第一个文档。它与find()类似,但只返回一个文档。方法用于计算满足条件的文档数量。distinct()方法用于获取指定字段的不同值列表。sort():sort()方法用于对查询结果进行排序。limit():limit()方法用于限制返回结果的数量。

2023-08-08 14:26:32 277

原创 对smote的理解

假设我们选择K=5,对于正类别中的一个样本,找到其5个最近邻样本,并在这5个样本中随机选择一个样本。假设我们选择了与该样本距离最近的一个样本,然后计算这两个样本之间的差值,并乘以一个随机数0.2,加到此前选择的样本上。最终得到一个新的合成样本。用真实数据测试,原始数据由10000条样本构成,其中正例1848例,负例8152例,使用XGB模型测试,smote后新增正样本2228例,在不使用smote时模型在oot上的 ks0.125 ,使用smote后 模型在oot上的 ks0.090。

2023-08-04 16:48:45 329

原创 逻辑回归:极大似然估计推导二分类的交叉熵损失函数

σz11e−zσz1e−z1​其中,zzzzβ0β1x1β2x2βnxnzβ0​β1​x1​β2​x2​βn​xn​β0β1β2βnβ0​β1​β2​βn​是模型的参数,x1x2xnx1​x2​xn​是输入特征。逻辑函数的输出σzσ(z)σz表示输入样本属于正例的概率,而1−σz1−σ(z)1−σz。

2023-08-03 15:08:54 592

原创 git 学习笔记

在Git中,每次提交都会生成一个新的提交对象,该对象包含了当前代码仓库的状态以及提交的相关信息,比如提交作者、提交时间、提交说明等。提交是一个本地操作,其他人在你的本地仓库中无法看到这些提交,直到你将它们推送到远程仓库。你可以将这想象成“改写历史”,但是这种“改写历史”的方法对大家一起使用的远程分支是无效的。提交在版本控制中起到了非常重要的作用,它可以记录代码的历史变更,让你可以随时回退到过去的状态或者查看代码的演变历史。,加上 -b 是 创建一个新的分支同时切换到新创建的分支。并没有当前分支的修改内容。

2023-07-31 19:56:10 36

转载 风险控制-如何理解信用模型中的拒绝推断

原文连接如我在前面的文章(风险控制-基于逻辑回归的信用申请评分卡建立流程-20170926)中说到的,评分卡用到的建模样本一般是针对于放款的样本,也就是最终过件的样本。然而在实际流程中,评分卡需要预测的样本要比最终过件的样本要多,如评分策略的拒件,以及评分策略之后规则的拒件。这就导致预测的目标样本与建模样本之间是有一定差异的,那么如何衡量这种差异,如果差异很大,如何缩小。这就是信用模型中拒绝推断(也被称为拒绝演绎)的内容。拒绝推断的方法试图推断出拒绝样本的状态,然后将其加入建模样本,这样做的理由有两个:一是

2022-06-08 10:53:41 575

原创 python 80行实现贪吃蛇(非pygame) 摸鱼好帮手

python 实现贪吃蛇使用键盘上下左右进行控制import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.animation import FuncAnimationfrom matplotlib.colors import ListedColormapimport sys,argparseimport keyboardcmap = ListedColormap(('purple','yellow'))fig, ax

2022-01-13 11:09:53 3272

原创 python字符串实现扫雷 摸鱼好帮手

python字符串实现扫雷1、使用方法运行代码后,每次输入一个坐标,输入格式为 【2,3】(注意:不包含【】,表示第二行第三列)在坐标前输入‘b’,即表示标记该坐标位置,如果该坐标已经标记,则此操作可取消标记2、展示运行后输出如下:输入2,3后回车输入b1,3后再次输入b1,3后代码部分import numpy as npimport time#地图边界L = [10,10]#地雷数X = 10biaoti = ''for i in range(L[1]):

2022-01-13 11:02:10 278

原创 python 数组去重的方法

python 数组去重的方法def getNonRepeatList1(data): return list(set(data))def getNonRepeatList2(data): new_data = [] for i in range(len(data)): if data[i] not in new_data: new_data.append(data[i]) return new_data#多维数组适用,作用与

2022-01-12 20:37:19 5954

原创 风控指标整理(KS\PSI\WOE\IV)

TP(实际为正预测为正),FP(实际为负但预测为正),TN(实际为负预测为负),FN(实际为正但预测为负)先介绍几个相关的指标,以免混淆:准确率(accuracy,ACC):正确率(Precision,PRE),查准率:真阳性率(True Positive Rate,TPR),灵敏度(Sensitivity),召回率(Recall):假阳性率(False Positice Rate,FPR),误诊率( = 1 - 特异度):TP(实际为正预测为正),FP(实际为负但预测为正),TN(.

2021-12-29 17:02:50 1190

原创 python 数据通信

服务器from socket import *import threadingIP = "localhost"port = 40005tcp_server = socket(AF_INET,SOCK_STREAM)tcp_server.bind((IP, port))tcp_server.listen(128)print('listen at port :',port)socks = []st = []def handle(): while True:

2021-12-28 14:47:22 1308 1

原创 sklean之决策树学习笔记

#加载实例数据from sklearn.datasets import load_iris#加载sklearn库import sklearnx,y = load_iris(return_X_y=True)#读入数据#x为n行m列的array数组,其中n表示数据条数,m表示一条数据的特征#y为一行array数组,用数字表示类别clf = sklearn.tree.DecisionTreeClassifier()clf = clf.fit(x,y)#训练决策树sklearn.tree

2021-10-11 19:29:07 69

转载 python学习笔记1——数据表的连接pandas

merge语法规则merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indicator=False)作为一个功能完善、强大的语言,python的pandas库中的merge()支持各种内外连接。left与right:两个不同

2021-09-23 11:08:53 584

原创 python学习笔记

dataFarme 操作import pandas as pd#将两列数据合并为一个元组 data为一个dataFarme表id = []for i in range(len(data)): id.append((data['a'][i],data['b'][i]))data['id'] = id#将一个元组拆分为两列数据 data为一个dataFarme表data['a'] = [list(i)[0] for i in data['id']]data['b'] = [list(i)[

2021-09-16 20:15:08 66

原创 python数据清洗常用举例

python数据清洗常用举例数据展示练习代码import pandas as pdimport numpy as npimport osfrom datetime import datetime# review_date 转为时间戳形式# import matplotlib.pyplot as pltdata=pd.read_excel(r"C:\Users\10746\Desktop\aa\111.xlsx",engine='openpyxl')pd.set_option('d

2021-08-24 08:20:38 1780 1

原创 灰度图像的彩色复原方法 ——以人脸着色为例

**摘要**:灰度图像彩色复原在图像修复领域有广泛的应用,由于其涉及从低纬度空间向高纬度空间的映射,故而修复效果存在差异。本文以人脸为例研究灰度图像的彩色复原方法,在主流灰度图像彩色修复算法的基础上,创新性的引入面部色彩分类指标,其依据人脸面部纹理特征将面部肤色分为36类,然后基于纹理分类指标创建模型,使得模型能够对灰度图像依据面部纹理特征,通过特征提取、灰箱模型、模拟上色进行分类着色。最后对模型进行数值测试,测试结果优良。

2021-08-18 09:15:22 7919 2

原创 tableau可视化面板制作

tableau可视化面板制作效果视频 tableau可视化看板 仪表板 要点记录(1)实现文字筛选,需要使用参数;在视频中,可以点击KPI指标选择指标口径,在主体图表中也会跟随KPI自动变化,这里使用的是参数进行控制,在操作中使用点击出发参数改变完成交互;(2)图表与图表关联筛选;关联筛选中,主要使用操作筛选器,依据表格的数目添加筛选个数完成关联;(3)直方图绘制;直方图使

2021-08-17 12:18:48 797

原创 tableau制作玫瑰图

tableau制作玫瑰图在分析保险险种占比时,使用玫瑰图绝对是一个很好的选择。在本文记录一下自己制作过程中踩到的坑及解决办法。操作流程1、数据准备解释:1、第一列为扇形个数的标志,也就是第一列去重后有多少条记录,最终做出的图像就有多少扇形块;2、第二列为同一扇形块下色彩的区分;3、第三列为体现的指标值;4、第四列为首位标记,首位标记的添加为将所有数据复制一遍后上下拼接,将原数据标记为0,复制粘贴的新数据标记为1。2、path创建新建参数:命名为 间隙,用于后期调整各个扇形之间的空白大

2021-08-16 11:15:54 2575

原创 office快速制作贺报方法

office/wps快速制作贺报方法使用背景在保险、地产、中介等行业,经常需要制作贺报,且每次制作都是批量的填入指标达成情况等文字信息,制作过程繁琐复杂,故而制作快速贺报制作工具,使用VBA编写,能适合任何安装有office/wps的个人电脑。视频演示 快速贺报制作 代码部分Sub 贺报生成() Dim weizhi As String Dim idx

2021-08-12 10:38:38 1495

原创 牛客网mysql困难类题目自写答案

最近做了一下牛客网困难部分的题目,打一下卡#牛客12select * from dept_emp;select * from salaries;select m.dept_no,m.emp_no,m.salary maxSalary from(select rank() over(partition by a.dept_no ORDER BY b.salary DESC) dd,a.dept_no,a.emp_no,b.salary from dept_emp a,salaries b whe

2021-08-12 10:02:32 88

原创 使用excel宏完成数据筛选并且保持为图片

**使用excel宏完成数据筛选并且保持为图片**原创 引用请说明出处在保险业务追踪过程中,需要将清单数据一对一微信发送相关人员,传统方法是对数据清单手动筛选,然后复制入微信(通过复制完成截图过程),然后发送。本文将介绍通过excel宏完成数据的自动筛选并截图保存于指定文件夹下。效果视频 快速筛选截图操作流程演示 代码部分Sub 业务员分组截图()''' On E

2021-08-12 09:51:19 1181

原创 传染病模型及实现(附MATLAB代码)

人口增长模型及实现(附MATLAB代码)问题一只游船上有800人,一名游客不慎患传染病,12小时后有3人发病,由于船上不能及时隔离,问经过72小时,患此病的人数。思路假设游客在船上均匀分布,与患者接触的人都有一定几率患病,此模型中认为患者上、下、左、右四个单位为与患者接触的人,而患者分布在每一个单位时间都会变化,由此可得以下代码:n=800;%总人数ts=12;fs=3;t=0;...

2018-12-11 14:25:11 30704 7

特征工程示例 围绕模型方面

特征工程示例 围绕模型方面

2023-02-27

灰度人脸着色代码文件(本科毕业论文).rar

灰度人脸着色代码文件(本科毕业论文).rar

2021-08-18

使用tableau制作玫瑰图.zip

tableau制作玫瑰图

2021-08-16

ppt快速贺报制作(简单易懂)

通过vba直接将excel数据按设计规则导入ppt中,制作贺报 https://blog.csdn.net/weixin_44055664/article/details/119636404?spm=1001.2014.3001.5502

2021-08-12

一个新的滤波模型,自己设计的.rar

本资源包包含4种滤波方法,有均值滤波,统计顺序滤波、自适应中值滤波,以及构建的一个全新的滤波模型,并带有SSIM与PSNR参数,其在椒盐比达到0.8的情况下仍能较好的还原图像

2020-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除