8/11
还是在继续看代码,之后这个项目好像是要我来维护了,维护的话要知道业务流程,能够快速的定位哪里出现了问题
对pandas还是有很多不熟练的,pandas真的好灵活,能想到的sql操作,以及衍生都有提供相应的接口
pandas
- pandas.rename({}):字典里面是原列名和新列名
- python装饰器:内置的有@property,@staticmethod,@classmethod,可以自己定义相应功能的装饰器,用于代码重用,带参数的装饰器
- df['column'].value_counts():统计某一列不同值的个数,dict(df[].value_counts())
- [x if x%2 else -x for x in range(10)]和[x for x in range(10) if x%2]的区别
- df.to_dict(orient='dict'),返回二维字典,外层key为列名
- df[].astype(str):改变某字段的数据类型
- df.drop_duplicates:去除重复项
- subset:指定特定的列去除重复项
- keep:删除重复项并且保留第一次出现的项或者最后一项或者全部去除
- pd.merge:将两个df进行连接操作,on