#本数据未发现异常值,故不作处理
#文本处理
'''Userupdate_Info 表中的 UserupdateInfo1 字段,属性取值为英⽂文字符,
包含了⼤大小写,如 “QQ”和“qQ”,很明显是同⼀一种取值,我们将所有 字符统⼀一转换为小写。'''
train_update['UserupdateInfo1']=train_update['UserupdateInfo1'].apply(lambda x:np.char.lower(x))
'''train中 UserInfo_9 字段的取值包含了空格字符,如“中国移 动”和“中国移动 ”, 它们是同⼀一种取值,需要将空格符去除。'''
train['UserInfo_9']=train['UserInfo_9'].applypply(lambda x:x.strip())
'''UserInfo_8 包含有“重庆”、“重庆市”等取值,它们实际上是同⼀一个城 市,需要把 字符中的“市”全部去掉。去掉“市”之后,城市数由 600 多下 降到 400 多'''
train['UserInfo_8']=train['UserInfo_8'].apply(lambda x:x[:-1] if x[-1]=='市' else x )