Python数据操作汇总
-
-
-
- 创建dataframe
- dataframe 改变列名
- dataframe 排序
- 列表推导式
- 重复repeat
- 查看dataframe变量信息
- 查看dataframe维度
- dataframe去掉重复
- dataframe描述
- dataframe按列计数
- dataframe切片操作
- isin判断 %in%
- 赋随机值
- 根据条件在数字前加负号
- 去掉缺失值
- apply的lambda操作
- dataframe的竖直拼接rbind操作
- mergy 合并
- 类似aggregate的分类合计
- dataframe多列合并为一列 stack操作
- python pivot_table 数据透视表
- python 改变变量类型 astype
- dataframe删除列 drop
- 计算dataframe相关系数corelation
- 多重判断选择 或判断 操作or %in%
- 返回判断索引 which where操作
- 判断索引 根据值比较大小
- list to pandas series
-
-
创建dataframe
df=pd.DataFrame([[list1],[list2]...].T,index=['list1','list2'])
dataframe 改变列名
方法一
df.columns=['names','scores']
方法二 reindex以及reindex_like
index是行 columns是列
df.reindex(index=['c', 'f', 'b'], columns=['three', 'two', 'one'])
df.reindex(['c', 'f', 'b'], axis='index')
df.reindex_like(df2)
方法三 rename
movies_df.rename(columns={
'Runtime (Minutes)': 'Runtime',
'Revenue (Millions)': 'Revenue_millions'
}, inplace=True)
df.rename(columns={
'one': 'foo', 'two': 'bar'},
index={
'a': 'apple', 'b': 'banana', 'd': 'durian'})
dataframe 排序
df.sort_values(by=['list1','list2'],ascending=True)