数据分析学习日记
2020.07.10
SQL
- row_numbers() over (partition by 字段1 order by 字段2)as flag:将数据集根据字段1分类,每一类再按照字段2排序,并打上标签flag来反应这种分类和排序。
- 相比之下,group by 的排序主要反应一类按照类别对其他变量综合运算的结果,而row_numbers只是单纯的打标签。
Pandas
- pandas中的series对象不能直接用int、str等函数改变数据对象,需要用apply函数和lambda函数来操作
- df.append(df1)为合并行专用;pd.concat(df1,df2,axis=1/0)即可合并行,也可合并列,axis为0合并行,axis为1合并列