处理数据时发现有那种非空空值的情况,使用fillna或者是dropna的时候都无法去除的情况。
原始数据:
使用各种方法后的结果:
怎么做都处理不掉。
处理这种问题的时候需要用到re才能去除这些讨厌的非空空值。以下是代码:
#先正则化只提取数字
df['test_data'] = df['test_data'].apply(lambda x: re.findall(r'\d+', x))
#后续根据是否list进行填空,这里我用的是0来填空
df['test_data'] = df['test_data'].apply(lambda x: 0 if len(x) == 0 else x[0])
以下是处理完后的数据: