1.用数据生成DataFrame
# -*- coding: UTF-8 -*-
import pandas as pd
# 方法一
d1 = [{'col1':'a', 'co12':1}, {'col1':'b', 'co12':2}, {'col1':'c', 'co12':3}]
df = pd.DataFrame(d1)
print df
# 方法二
data = [['a', 1], ['b', 2], ['c', 3]]
df = pd.DataFrame(data, columns=['col1', 'col2'])
print df
# 方法三
df = pd.DataFrame({'col1': ['a', 'b', 'c'], 'col2': [1, 2, 3]})
print df
输出结果:
co12 col1
0 1 a
1 2 b
2 3 c
2.Dataframe常用方法:
# 查看列名
print df.columns
----------
Index([u'co12', u'col1'], dtype='object')
# 查看数据
print df.values
----------
[[1L 'a']
[2L 'b']
[3L 'c']]
# 查看数据类型
print df.dtypes
----------
co12 int64
col1 object
dtype: object
# 查看前n行
print df.head(2)
----------
co12 col1
0 1 a
1 2 b
# 查看后n行
print df.tail(2)
----------
co12 col1
1 2 b
2 3 c
# 排序
print df.sort_values(by='col1', ascending=False)
----------
co12 col1
2 3 c
1 2 b
0 1 a
# 转置
print df.T
----------
0 1 2
co12 1 2 3
col1 a b c
# 设置index
df = df.set_index('col1')
print df.index
----------
Index([u'a', u'b', u'c'], dtype='object', name=u'col1')