Pandas
chixujohnny
蚂蚁金服-高级算法工程师
展开
-
Pandas 创建空的DataFrame
平时写pyhton的时候习惯初始化一些list啊,tuple啊,dict啊这样的。一用到Pandas的DataFrame数据结构也就总想着初始化一个空的DataFrame,虽然没什么太大的用处,不过还是记录一下:# 创建一个空的 DataFramedf_empty = pd.DataFrame(columns=['A', 'B', 'C', 'D'])上面创建的DataFrame有原创 2017-01-06 09:45:31 · 196066 阅读 · 3 评论 -
Pandas 合并多个Dataframe(merge,concat)
在数据处理的时候,尤其在搞大数据竞赛的时候经常会遇到一个问题就是,多个表单的合并问题,比如一个表单有user_id和age这两个字段,另一个表单有user_id和sex这两个字段,要把这两个表合并成只有user_id、age、sex三个字段的表怎么办的,普通的拼接是做不到的,因为user_id每一行之间不是对应的,像拼积木似的横向拼接肯定是不行的。pandas中有个merge函数可以做到这个实用的原创 2017-03-29 10:08:02 · 133124 阅读 · 3 评论 -
Pandas 对Dataframe结构排序
Dataframe结构放在numpy来看应该是二维矩阵的形式,每一列是一个特征,上面会有个列标题,每一行是一个样本。对Dataframe结构的某一列进行排序方法如下:# 对df表中的user_id这一列进行排序,默认是从小到大排df = df.sort_index(by='user_id')对多列进行排序方法如下:# 对user_id,sku_id这两列进行排序df = df原创 2017-03-29 16:32:17 · 9688 阅读 · 0 评论