利用pandas对excel文件进行初步清洗
1.导库
import numpy as np
import pandas as pd
import os
2.读文件
job_data=pd.read_excel(‘原始数据.xls’)
3.查看缺失值并进行处理
#查看缺失值
job_data.isnull().sum()
城市的缺失值可以通过公司全名来获取到以填补缺失值
data0=job_data[job_data[‘城市’].isnull()]
a=job_data[‘城市’].isnull()
job_data.loc[a,‘城市’]=jo
原创
2020-11-12 21:23:57 ·
1284 阅读 ·
0 评论