针对上一节的练习问题,以下为参考代码。
首先将数据表完整的在Python中表示出来。
import pandas as pd
from pandas import DataFrame
from pandasql import sqldf, load_meat, load_births
data={'Chinese':[66,95,95,90,80,80],'English':[65,85,92,88,90,90],'Math':[None,98,96,77,90,90]}
df=pd.DataFrame(data,index=['ZhangFei','GuanYu','ZhaoYun','HuangZhong','DianWei','DianWei'],columns=['Chinese','English','Math'])
print(df)
运行结果:
Chinese English Math
ZhangFei 66 65 NaN
GuanYu 95 85 98.0
ZhaoYu 95 92 96.0
HuangZhong 90 88 77.0
DianWei 80 90 90.0
DianWei 80 90 90.0
接下来,我们看到DianWei
行重复了,因此去重复的行,以及将各科名称重命名为中文。
#去重复行
df=df.drop_duplicates()
#列名重命名
df.rename(columns