![](https://img-blog.csdnimg.cn/46791fed08ce46b1a3c6c49638276028.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
pyodps
文章平均质量分 88
阿里云的DataFrame ODPS的python接口使用进行讲解
橙子园
落地生根,长成参天大树
展开
-
pyodps中一些经验:取分组排序后的第一条数据
pyodps中有很多本来在pandas中一个API解决的东西却要想半天才能搞定。pandas中在groupby后只要用first就可以去出分组后的第一行。例如:# 以student_id为分组列,然后取出分组后每组的第一条数据df_stu_frist_course = df_stu_course.groupby('student_id').first()然而pyodps中却很坑...原创 2019-01-24 18:57:45 · 5820 阅读 · 0 评论 -
pyodps中的apply用法
apply在pandas里非常好用的,那在pyodps里如何去使用,还是有一些区别的在pyodps中要对一行数据使用自定义函数,可以使用 apply 方法,axis 参数必须为 1,表示在行上操作。apply 的自定义函数接收一个参数,为上一步 Collection 的一行数据,用户可以通过属性、或者偏移取得一个字段的数据。iris.apply(lambda row: row.sep...转载 2019-01-25 13:23:40 · 1993 阅读 · 1 评论 -
建数仓表时TypeError: expected type 'int' but type 'datetime.date' found
一直在maxcomputer上用pyodps建数仓表,讲讲其中一个巨大的坑就是它存储时间的时候是最后都是转化成时间戳存储的,如果你想把datetime类型的日期取出date存进去就会报:TypeError: expected <type 'int'> but <type 'datetime.date'> found例如: # pay_time是...原创 2019-01-23 09:50:32 · 1159 阅读 · 0 评论