- 博客(7)
- 资源 (8)
- 收藏
- 关注
原创 保险业务知识
有效保单:剔除失效、注销、退保的保单,且终保日期在评估日期之后,这些保单都会对应一个批改code,根据保险公司的业务定义来识别;或者如果有未到期保单表,未到期保单表中的保单就是截止评估日期的有效保单。未完待续。。。。...
2022-03-09 22:35:59
613
原创 数据分析实战——日化用品在门店的销售分析
这是一个竞赛的题目,包括但不限于以下分析维度:各门店商品销量与利润,时间趋势各类别商品销量与利润各价格区间内的畅销商品与滞销商品销售淡季和销售旺季的商品销量分布根据以上分析目的,主要进行利润、时间、销量指标的数据处理,基础数据包括三张表,分别是2019年销售信息、门店信息、商品信息表:import pandas as pdimport numpy as npfrom IPython.core.interactiveshell import InteractiveShellInterac
2021-12-30 22:24:49
1143
原创 如何解决二分类中的样本不平衡问题
在搭建模型时,二分类中,经常会遇到目标变量的分类数量相差很大,比如分类是1的数量是5000,分类是0的数量是100,这样如果对数据的不平衡性不做处理,模型的效果也会很差。今天用一个案例来进行实操:1、**案例目的**:找出有资金需求的中小企业借贷户并销售其贷款产品2、**背景**:对于中小企业而言,要快速成长最需要的就是资金。若能找出这些有资金需求的中小企业公司户并销售其贷款产品,将能为银行带来不少的营收,并改善中小企业的经营。3、**数据说明**训练数据包含26,144笔客户资料;每笔客户资料
2021-12-23 21:48:32
4761
1
原创 db2 时间戳相减返回天数
db2时间戳类型时间相减返回天数,先用timestampdiff函数让时间戳相减得到秒,然后利用cast()函数转换成天数。select cast(timestampdiff(2,(CURRENT_TIMESTAMP - '2021-08-10 11:00:00')) as double)/86400 from sysibm.dual返回结果:...
2021-08-11 16:52:58
2012
原创 python 取差集和交集
工作中,我们对比数据时,常常用到差集和交集。#取差集,取data1在data中没有的公司,如果是data中有,data1中没有,则difference_set = set((data['公司'])).difference(set(data1['公司'])),交集时,用法一样。difference_set = set((data1['公司'])).difference(set(data['公司']))df = pd.DataFrame()df['差集'] = pd.Series(list(differ
2021-08-10 13:39:53
565
原创 python执行和读取db2 sql
python执行和读取db2 sqlimport pandas as pdimport ibm_dbimport ibm_db_dbi#创建连接数据库,conn用来读取,engine用来执行conn = ibm_db_dbi.connect(数据库名,用户名,密码)engine = ibm_db.connect(数据库名,用户名,密码)sql_create = '''create table 表名 as (select * from 表) definition only'''sql_se
2021-08-09 14:45:45
472
1
原创 python 多行数据分成多个excel输出
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用编辑器
2021-08-09 14:32:15
707
C# 窗体透明+鼠标穿透
2020-08-01
ZXing-2.2 源码及编译后的jar包
2013-09-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人