2022年泰迪杯数据分析_B题:银行客户忠诚度分析赛题数据_任务四

import pandas as pd
long_data21=pd.read_excel('result1_2.xlsx')
long_data25=pd.read_excel('result3.xlsx')

long_data21['Status']=long_data25['Status']
long_data21['AssetStage']=long_data25['AssetStage']
long_data21
CustomerIdCreditScoreGenderAgeTenureBalanceNumOfProductsHasCrCardIsActiveMemberEstimatedSalaryExitedStatusAssetStage
0155532517131520185891.5411146369.57113
11555325661914180.0031179866.73122
215553283603142891611.12100144675.30120
31555330858916110.0011061108.56112
41555338768713920.00300188150.60112
..........................................
9175158156287111378113899.9210080215.20020
9176158156454810378152303.66211175082.20023
9177158156565411399100116.67111199808.10120
9178158156607581341154139.4511160728.89013
9179158156906141403113348.5011177789.01010

9180 rows × 13 columns

long_data21['Tenure'].unique()
array([ 0,  8,  1,  2, 10,  5,  9,  7,  4,  3,  6], dtype=int64)

构建新老客户活跃程度的特征,并将结果存于“IsActiveStatus”
列:根据题目pdf中表5的账户户龄划分区间,再结合用户的活跃状态,构建新老客户活跃程度的特征,存于IsActiveStatus列。

long_data22=long_data21.copy()
#long_data22['账号户龄']=0
long_data22.loc[(long_data22.Tenure>6) & (long_data22.IsActiveMember==1),'IsActiveStatus']=5
long_data22.loc[(long_data22.Tenure>6) & (long_data22.IsActiveMember==0),'IsActiveStatus']=2
long_data22.loc[(long_data22.Tenure<=3) & (long_data22.IsActiveMember==1),'IsActiveStatus']=3
long_data22.loc[(long_data22.Tenure<=3) & (long_data22.IsActiveMember==0),'IsActiveStatus']=0
long_data22.loc[(long_data22.IsActiveStatus.isna()) & (long_data22.IsActiveMember==1),'IsActiveStatus']=4
long_data22.loc[(long_data22.IsActiveStatus.isna()) & (long_data22.IsActiveMember==0),'IsActiveStatus']=1
long_data22.head(3)
CustomerIdCreditScoreGenderAgeTenureBalanceNumOfProductsHasCrCardIsActiveMemberEstimatedSalaryExitedStatusAssetStageIsActiveStatus
0155532517131520185891.5411146369.571133.0
11555325661914180.0031179866.731225.0
215553283603142891611.12100144675.301202.0

构建不同金融资产客户活跃程度的特征,并将结果存于
“IsActiveAssetStage”列:根据题目pdf中表6的客户金融资产划分区间,再结合用户的活跃状态,构建出不同金融资产客户活跃程度的特征,存于IsActiveAssetStage列。

long_data22.loc[(long_data22.Balance>120000) & (long_data22.IsActiveMember==1),'IsActiveAssetStage']=9
long_data22.loc[(long_data22.Balance>120000) & (long_data22.IsActiveMember==0),'IsActiveAssetStage']=3

long_data22.loc[(long_data22.Balance>90000) & (long_data22.Balance<=120000) & (long_data22.IsActiveMember==1),'IsActiveAssetStage']=8
long_data22.loc[(long_data22.Balance>90000) & (long_data22.Balance<=120000) & (long_data22.IsActiveMember==0),'IsActiveAssetStage']=2

long_data22.loc[(long_data22.Balance>50000) & (long_data22.Balance<=90000) & (long_data22.IsActiveMember==1),'IsActiveAssetStage']=7
long_data22.loc[(long_data22.Balance>50000) & (long_data22.Balance<=90000) & (long_data22.IsActiveMember==0),'IsActiveAssetStage']=1

long_data22.loc[(long_data22.Balance<=50000) & (long_data22.IsActiveMember==1),'IsActiveAssetStage']=6
long_data22.loc[(long_data22.Balance<=50000) & (long_data22.IsActiveMember==0),'IsActiveAssetStage']=0
long_data22.head(3)
CustomerIdCreditScoreGenderAgeTenureBalanceNumOfProductsHasCrCardIsActiveMemberEstimatedSalaryExitedStatusAssetStageIsActiveStatusIsActiveAssetStage
0155532517131520185891.5411146369.571133.09.0
11555325661914180.0031179866.731225.06.0
215553283603142891611.12100144675.301202.02.0

构建不同金融资产信用卡持有状态的特征,并将结果存于
“CrCardAssetStage”列:

long_data22.loc[(long_data22.Balance>120000) & (long_data22.HasCrCard==1),'CrCardAssetStage']=9
long_data22.loc[(long_data22.Balance>120000) & (long_data22.HasCrCard==0),'CrCardAssetStage']=5

long_data22.loc[(long_data22.Balance>90000) & (long_data22.Balance<=120000) & (long_data22.HasCrCard==1),'CrCardAssetStage']=9
long_data22.loc[(long_data22.Balance>90000) & (long_data22.Balance<=120000) & (long_data22.HasCrCard==0),'CrCardAssetStage']=5

long_data22.loc[(long_data22.Balance>50000) & (long_data22.Balance<=90000) & (long_data22.HasCrCard==1),'CrCardAssetStage']=7
long_data22.loc[(long_data22.Balance>50000) & (long_data22.Balance<=90000) & (long_data22.HasCrCard==0),'CrCardAssetStage']=2

long_data22.loc[(long_data22.Balance<=50000) & (long_data22.HasCrCard==1),'CrCardAssetStage']=6
long_data22.loc[(long_data22.Balance<=50000) & (long_data22.HasCrCard==0),'CrCardAssetStage']=0
long_data22.head(3)
CustomerIdCreditScoreGenderAgeTenureBalanceNumOfProductsHasCrCardIsActiveMemberEstimatedSalaryExitedStatusAssetStageIsActiveStatusIsActiveAssetStageCrCardAssetStage
0155532517131520185891.5411146369.571133.09.09.0
11555325661914180.0031179866.731225.06.06.0
215553283603142891611.12100144675.301202.02.05.0
long_data22.to_excel("result4.xlsx",encoding = 'openpyxl',index = False)

  • 6
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值