1、读取数据
import pandas as pd
pd.read_csv(“1.csv”)#读取当前文件夹下的1.csv文件
pd.head#显示头部数据
2、写入数据
pd.to_csv(“1.csv”)#将pd对象的内容写到当前路径下的 1.csv
3、排序
>>> dd=pd.DataFrame({'a':[1,2,3],'b':[2,4,3],'c':[5,3,2]})#利用字典生成一个pandas的DataFrame,它会自动添加序号(index)列到DataFrame
>>> dd
a b c
0 1 2 5
1 2 4 3
2 3 3 2
>>> dd.sort_values("a",ascending=False)#将生成的DataFrame按照a列排序,ascending=False就是“降序”的意思。
a b c
2 3 3 2
1 2 4 3
0 1 2 5
4、reset_index()用法
#>>> dd=pd.DataFrame({‘a’:[1,2,3],‘b’:[2,4,3],‘c’:[5,3,2]})
#>>> dd
a b c
0 1 2 5
1 2 4 3
2 3 3 2
#>>> dd.index.name=‘id’#指定索引列的名称为‘id’
#>>> dd
a b c
id
0 1 2 5
1 2 4 3
2 3 3 2
#>>> de=dd.reset_index()#调用reset_index函数重新添加一列索引列
#>>> de
id a b c
0 0 1 2 5
1 1 2 4 3
2 2 3 3 2
#>>> df=dd.sort_values(“id”,ascending=False)
#>>> df
a b c
id
2 3 3 2
1 2 4 3
0 1 2 5
5、常用函数
代码 功能
1 DataFrame() 创建一个DataFrame对象
2 df.values 返回ndarray类型的对象
3 df.index 获取行索引
4 df.columns 获取列索引
5 df.axes 获取行及列索引
6 df.T 行与列对调
7 df. info() 打印DataFrame对象的信息
8 df.head(i) 显示前 i 行数据
9 df.tail(i) 显示后 i 行数据
10 df.describe() 查看数据按列的统计信息
df.head(2)#显示头两行的内容
df.axes 获取行及列索引
6、新增行
注意:这里一定要使用df=df.append()这样的形式否则df的内容不会改变
7、删除某列
方法一:直接del df[‘column-name’]