1、更改表格中列数据得类型
df_yhcdhpye = pd.read_excel(r'../data/in/表外清单.xlsx',
dtype={'协议余额(原币种)': int, '行政区划代码': str,
'放贷机构行政区划代码': str, '担保方式(保证\信用\抵押\质押)':str,
'担保方式': str})
2、将相应字段匹配到相应的代码
#替换字符串
count_row = len(df_merge)
for _ in range(count_row):
if df_merge.iloc[_][50] == '质押':
if df_merge.iloc[_][51] == '保证金':
df_merge.loc[_, '担保方式代码'] = 'A02'
elif df_merge.iloc[_][51] == '我行人民币存款质押':
df_merge.loc[_, '担保方式代码'] = 'A01'
elif df_merge.iloc[_][50] == '抵押':
df_merge.loc[_, '担保方式代码'] = 'B'
elif df_merge.iloc[_][50] == '保证':
df_merge.loc[_, '担保方式代码'] = 'C'
elif df_merge.iloc[_][50] == '信用':
df_merge.loc[_, '担保方式代码'] = 'D'
3、对数据有缺省值的时候,将小数转换为百分数,缺省值置为空
df_merge[u'借据年利率'] = df_merge[u'借据年利率'].apply(lambda x: format(x, '.2%'))
for _ in range(len(df_merge)):
if df_merge.loc[_,["借据年利率"]].any() in ['nan%']:
df_merge.loc[_,["借据年利率"]] = ''
4、通过指定日期找出具体数据
df_wtdkfse.insert(1, '筛选日期', df_wtdkfse['签发日期'])
df_wtdkfse = df_wtdkfse.set_index('筛选日期')
date = st_date[:-3]
print(date)
df_wtdkfse = df_wtdkfse[date]
print(df_wtdkfse)
5、将excel中的缺省数据置为空值
keep_default_na=False
6、去掉excel中小数部分的数据使用round(0)
df_cldk[['小类']] = df_cldk[['小类']].round(0)
df_cldk[['贷款投向小类代码']] = df_cldk[['贷款投向小类代码']].round(0)