- 博客(6)
- 收藏
- 关注
原创 2021招行Fintech数据赛Rank15开源分享
一、赛题理解时序预测、回归类问题任务一:预测未来一个月,A/B两个岗位按天的业务量任务二:预测未来一个月,A/B两个岗位每天48个时段的细分业务量(半小时一个时间段)数据:date:日期post_id:A、B两种业务类型biz_type:业务类型细分,A有13种,B只有一种period:时段(每天48个)amount:业务量(label)PS;我又截图截晚了,官网只剩下这点了。。二、数据预处理周期性取2020年11月的数据观察,分A/B两种业务类型,可以发现具有明显的周期
2021-05-14 16:00:25 2319 5
原创 Jupyter中显示DataFrame的行显示不完全
1.如果要显示全部行:import pandas as pdpd.set_option('display.max_columns', None) #显示所有列pd.set_options('display.max_rows', None) #显示所有行2.如果要显示部分行,以100为例pd.set_option('display.min_rows', 100)使用前:使用后:...
2020-10-30 12:06:00 1573
原创 dataframe_note
1.选取特定值的行(两条限定)train[(train.kpi_id=='0528d024-7cb5-4e15-910f-39fb74b68625') & (train.label)==1]
2020-10-25 16:55:59 178
原创 基本排序算法(适合新手学习)
def quick_sort(b): """快速排序""" if len(b) < 2: return arr # 选取基准,随便选哪个都可以,选中间的便于理解 mid = arr[len(b) // 2] # 定义基准值左右两个数列 left, right = [], [] # 从原始数组中移除基准值 b.remove(mid) for item in b: # 大于基准值放右边
2020-08-14 09:27:16 172
原创 2020招行FinTech数据赛,线上0.78026,最终53名~~菜鸡分享
题目嘛,大概就是就是一个信用评分预测,评判指标为AUC。(官网已经查不到了,大家看看找找别的帖子看看吧)一、数据预处理部分(一)缺失值处理的较为粗糙,tag表中\N和~都当做缺失值处理了。(改进点1)三个和教育相关的列,其中两个缺失值较多,删除处理。字符编码转数字:采用LabelEncoder()编码。注意,要把train和test合并再进行处理,否则会出现编码不同的情况。数字缺失值填充:分析字段含义,大部分根据众数填充。有一些直接按照经验填充,例如:贷款标识我认为如果在招行贷款,招行忘了标记
2020-05-15 11:52:43 1180 1
原创 电讯技术投稿分享
先放时间节点:投稿 2019-12-11一审 2019-12-13~2019-12-29修回 2020-01-03~2020-01-11再审 2020-01-16~2020-02-21(赶上疫情和春节期间,时间有点长可以理解)修回 2020-02-24终审 2020-02-26~2020-03-03拟录用 2020-03-04过程一审期间三位审稿人,一个通过,两个修改后再...
2020-03-05 22:47:34 2703 5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人