自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 2021招行Fintech数据赛Rank15开源分享

一、赛题理解时序预测、回归类问题任务一:预测未来一个月,A/B两个岗位按天的业务量任务二:预测未来一个月,A/B两个岗位每天48个时段的细分业务量(半小时一个时间段)数据:date:日期post_id:A、B两种业务类型biz_type:业务类型细分,A有13种,B只有一种period:时段(每天48个)amount:业务量(label)PS;我又截图截晚了,官网只剩下这点了。。二、数据预处理周期性取2020年11月的数据观察,分A/B两种业务类型,可以发现具有明显的周期

2021-05-14 16:00:25 2171 5

原创 Jupyter中显示DataFrame的行显示不完全

1.如果要显示全部行:import pandas as pdpd.set_option('display.max_columns', None) #显示所有列pd.set_options('display.max_rows', None) #显示所有行2.如果要显示部分行,以100为例pd.set_option('display.min_rows', 100)使用前:使用后:...

2020-10-30 12:06:00 1510

原创 dataframe_note

1.选取特定值的行(两条限定)train[(train.kpi_id=='0528d024-7cb5-4e15-910f-39fb74b68625') & (train.label)==1]

2020-10-25 16:55:59 151

原创 基本排序算法(适合新手学习)

def quick_sort(b): """快速排序""" if len(b) < 2: return arr # 选取基准,随便选哪个都可以,选中间的便于理解 mid = arr[len(b) // 2] # 定义基准值左右两个数列 left, right = [], [] # 从原始数组中移除基准值 b.remove(mid) for item in b: # 大于基准值放右边

2020-08-14 09:27:16 166

原创 2020招行FinTech数据赛,线上0.78026,最终53名~~菜鸡分享

题目嘛,大概就是就是一个信用评分预测,评判指标为AUC。(官网已经查不到了,大家看看找找别的帖子看看吧)一、数据预处理部分(一)缺失值处理的较为粗糙,tag表中\N和~都当做缺失值处理了。(改进点1)三个和教育相关的列,其中两个缺失值较多,删除处理。字符编码转数字:采用LabelEncoder()编码。注意,要把train和test合并再进行处理,否则会出现编码不同的情况。数字缺失值填充:分析字段含义,大部分根据众数填充。有一些直接按照经验填充,例如:贷款标识我认为如果在招行贷款,招行忘了标记

2020-05-15 11:52:43 1137 1

原创 电讯技术投稿分享

先放时间节点:投稿 2019-12-11一审 2019-12-13~2019-12-29修回 2020-01-03~2020-01-11再审 2020-01-16~2020-02-21(赶上疫情和春节期间,时间有点长可以理解)修回 2020-02-24终审 2020-02-26~2020-03-03拟录用 2020-03-04过程一审期间三位审稿人,一个通过,两个修改后再...

2020-03-05 22:47:34 2455 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除