工作使用
羊驼养殖户
数据分析学习中
展开
-
groupby后对数据的聚合处理方法汇总
优势:简单便捷对B列计数,C列求和,列名称分别为B。原创 2023-08-17 17:48:01 · 465 阅读 · 0 评论 -
Glove的一个小例子
【代码】Glove的一个小例子。原创 2023-08-15 13:58:54 · 37 阅读 · 0 评论 -
风险控制-如何理解信用模型中的拒绝推断
原文连接如我在前面的文章(风险控制-基于逻辑回归的信用申请评分卡建立流程-20170926)中说到的,评分卡用到的建模样本一般是针对于放款的样本,也就是最终过件的样本。然而在实际流程中,评分卡需要预测的样本要比最终过件的样本要多,如评分策略的拒件,以及评分策略之后规则的拒件。这就导致预测的目标样本与建模样本之间是有一定差异的,那么如何衡量这种差异,如果差异很大,如何缩小。这就是信用模型中拒绝推断(也被称为拒绝演绎)的内容。拒绝推断的方法试图推断出拒绝样本的状态,然后将其加入建模样本,这样做的理由有两个:一是转载 2022-06-08 10:53:41 · 575 阅读 · 0 评论 -
风控指标整理(KS\PSI\WOE\IV)
TP(实际为正预测为正),FP(实际为负但预测为正),TN(实际为负预测为负),FN(实际为正但预测为负)先介绍几个相关的指标,以免混淆:准确率(accuracy,ACC):正确率(Precision,PRE),查准率:真阳性率(True Positive Rate,TPR),灵敏度(Sensitivity),召回率(Recall):假阳性率(False Positice Rate,FPR),误诊率( = 1 - 特异度):TP(实际为正预测为正),FP(实际为负但预测为正),TN(.原创 2021-12-29 17:02:50 · 1190 阅读 · 0 评论 -
sklean之决策树学习笔记
#加载实例数据from sklearn.datasets import load_iris#加载sklearn库import sklearnx,y = load_iris(return_X_y=True)#读入数据#x为n行m列的array数组,其中n表示数据条数,m表示一条数据的特征#y为一行array数组,用数字表示类别clf = sklearn.tree.DecisionTreeClassifier()clf = clf.fit(x,y)#训练决策树sklearn.tree原创 2021-10-11 19:29:07 · 69 阅读 · 0 评论 -
python学习笔记1——数据表的连接pandas
merge语法规则merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indicator=False)作为一个功能完善、强大的语言,python的pandas库中的merge()支持各种内外连接。left与right:两个不同转载 2021-09-23 11:08:53 · 584 阅读 · 0 评论 -
python学习笔记
dataFarme 操作import pandas as pd#将两列数据合并为一个元组 data为一个dataFarme表id = []for i in range(len(data)): id.append((data['a'][i],data['b'][i]))data['id'] = id#将一个元组拆分为两列数据 data为一个dataFarme表data['a'] = [list(i)[0] for i in data['id']]data['b'] = [list(i)[原创 2021-09-16 20:15:08 · 66 阅读 · 0 评论 -
tableau可视化面板制作
tableau可视化面板制作效果视频 tableau可视化看板 仪表板 要点记录(1)实现文字筛选,需要使用参数;在视频中,可以点击KPI指标选择指标口径,在主体图表中也会跟随KPI自动变化,这里使用的是参数进行控制,在操作中使用点击出发参数改变完成交互;(2)图表与图表关联筛选;关联筛选中,主要使用操作筛选器,依据表格的数目添加筛选个数完成关联;(3)直方图绘制;直方图使原创 2021-08-17 12:18:48 · 797 阅读 · 0 评论 -
tableau制作玫瑰图
tableau制作玫瑰图在分析保险险种占比时,使用玫瑰图绝对是一个很好的选择。在本文记录一下自己制作过程中踩到的坑及解决办法。操作流程1、数据准备解释:1、第一列为扇形个数的标志,也就是第一列去重后有多少条记录,最终做出的图像就有多少扇形块;2、第二列为同一扇形块下色彩的区分;3、第三列为体现的指标值;4、第四列为首位标记,首位标记的添加为将所有数据复制一遍后上下拼接,将原数据标记为0,复制粘贴的新数据标记为1。2、path创建新建参数:命名为 间隙,用于后期调整各个扇形之间的空白大原创 2021-08-16 11:15:54 · 2575 阅读 · 0 评论 -
office快速制作贺报方法
office/wps快速制作贺报方法使用背景在保险、地产、中介等行业,经常需要制作贺报,且每次制作都是批量的填入指标达成情况等文字信息,制作过程繁琐复杂,故而制作快速贺报制作工具,使用VBA编写,能适合任何安装有office/wps的个人电脑。视频演示 快速贺报制作 代码部分Sub 贺报生成() Dim weizhi As String Dim idx原创 2021-08-12 10:38:38 · 1495 阅读 · 0 评论 -
使用excel宏完成数据筛选并且保持为图片
**使用excel宏完成数据筛选并且保持为图片**原创 引用请说明出处在保险业务追踪过程中,需要将清单数据一对一微信发送相关人员,传统方法是对数据清单手动筛选,然后复制入微信(通过复制完成截图过程),然后发送。本文将介绍通过excel宏完成数据的自动筛选并截图保存于指定文件夹下。效果视频 快速筛选截图操作流程演示 代码部分Sub 业务员分组截图()''' On E原创 2021-08-12 09:51:19 · 1181 阅读 · 0 评论