Pandas常用API

系列(Series)

pandas.Series( data, index, dtype, copy)
# data  数据采取各种形式
# index 索引值必须是唯一的和散列的,与数据的长度相同
# dtype dtype用于数据类型。如果没有,将推断数据类型
# copy  复制数据,默认为false

# eg1: 从ndarray创建一个系列
data = np.array(['a','b','c','d'])
s = pd.Series(data)
print s
output: 0   a
		1   b
		2   c
		3   d
		dtype: object

# eg2 :从字典创建一个系列
data = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data)
print s
output: a 0.0
		b 1.0
		c 2.0
		dtype: float64
		
# eg3 :从标量创建一个系列
s = pd.Series(5, index=[0, 1, 2, 3])
print s
output: 0  5
		1  5
		2  5
		3  5
		dtype: int64

数据帧(DataFrame)

pandas.DataFrame( data, index, columns, dtype, copy)
# data	数据采取各种形式,如:ndarray,series,map,lists,dict,constant和另一个DataFrame
# index	对于行标签,要用于结果帧的索引是可选缺省值np.arrange(n),如果没有传递索引值
# columns	对于列标签,可选的默认语法是 - np.arange(n)。 这只有在没有索引传递的情况下才是这样
# dtype	每列的数据类型
# copy	如果默认值为False,则此命令(或任何它)用于复制数据

# eg1: 从列表创建DataFrame
data = [1,2,3,4,5]
df = pd.DataFrame(data)
print df
output: 	 0
		0    1
		1    2
		2    3
		3    4
		4    5
data = [['Alex',10],['Bob',12],['Clarke',13]]
df = pd.DataFrame(data,columns=['Name','Age'])
print df
output:      Name      Age
		0     Alex      10
		1     Bob       12
		2     Clarke    13

# eg2 :从系列的字典来创建DataFrame
d = {'one' : pd.Series([1, 2, 3], index=['a', 'b', 'c']),
      'two' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print df
output:       one    two
		a     1.0    1
		b     2.0    2
		c     3.0    3
		d     NaN    4

# 列选择,添加和删除
df ['one']  # 选择 
df['four']=df['one']+df['three'] # 添加
del df['one'] # 删除

# 行选择,添加和删除
 df.loc['b'] # 选择
 df.iloc[2] # 	按整数位置选择
 df[2:4] # 行切片
 df = df.append(df2) # 附加行
 df = df.drop(0) # 删除行
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值