Python_pandas 两种主要的数据类型(Series、DataFrame)

本文详细介绍了Python_pandas的两种主要数据类型——Series和DataFrame,包括它们的属性、创建方法和实例。重点讲解了如何进行条件操作(如使用.ix[]和numpy.where)、根据条件选择DataFrame、Grouping以及apply函数的应用,提供了丰富的代码示例来展示这些操作的实际运用。
摘要由CSDN通过智能技术生成

Python_pandas 两种主要的数据类型(Series、DataFrame)

一)属性

series    :.index,.values, .name,.index.name
dataframe :.columns, .index,.values
 
 
 
  • 1
  • 2

二)创建方法 
series: 
一组数组(列表或元组),series除了一组数据外还包括一组索引(即只有行索引),索引可自行定义也可利用Series(),自动生成索引; 
dataframe: 
是表格型数据,既有行索引又有列索引,每列数据可以为不同类型数据(数值、字符串、布尔型值),可利用DataFrame(其他数据,dataframe属性)指定dataframe的属性创建dataframe。

三)实例 
3.1 创建series及其属性展示实例

代码

#创建series
import pandas as pd
obj_list=[1,2,3,4]
obj_tuple=(4,5,6,7)
obj_dict={'a':[1,2],'b':[2,3],'c':[3,4],'d':[4,5]}
obj_series_list=pd.Series(obj_list)#通过列表创建series
obj_series_tuple=pd.Series(obj_tuple,index=list('abcd'))#通过元组创建series
obj_series_dict=pd.Series(obj_dict)#通过字典创建series
#定义属性
obj_series_list.index.name='zimu'
obj_series_list.name='data'

print "#通过列表创建series"
print obj_series_list
print "#通过元组创建series"
print obj_series_tuple
print "#通过字典创建series"
print obj_series_dict
#显示series类型及属性
print type(obj_series_list),obj_series_list.dtype
print obj_series_list.index,obj_series_list.index.name
print obj_series_list.values,obj_series_list.name

运行结果

#通过列表创建series
zimu
0    1
1    2
2    3
3    4
Name: data, dtype: int64
#通过元组创建series
a    4
b    5
c    6
d    7
dtype: int32
#通过字典创建series
a    [1, 2]
b    [2, 3]
c    [3, 4]
d    [4, 5]
dtype: object
<class 'pandas.core.series.Series'> int64
RangeIndex(start=0, stop=4, step=1, name=u'zimu') zimu
[1 2 3 4] data

3.2创建dataframe及其属性展示实例 
在构建DataFrame时,最常用的就是先创建一个data,data一般可以是字典和数组,再用a=DataFrame(data)来转换为DataFrame结构。在DataFrame(data)时也可以同时传入index和columns参数,两个参数必须是list列表型

1)由数组、列表或元组组成的字典:,每个序列变成DataFrame的一列,所有序列的长度必须相同 
代码

#创建dataframe
import pandas as pd
import numpy as np
obj_dict={'a':[1,2],'b':[2,3],'c':[3,4],'d':[4,5]}
obj_array=np.array([[1,2,3,4],[3,4,5,6]])
obj_series_1=pd.Series([11,12,13,14])
obj_series_2=pd.Series([21,22,23,24])
obj_dataframe_dict=pd.DataFrame(obj_dict)#通过字典创建dataframe
obj_dataframe_array=pd.DataFrame(obj_array,index=['one','two'])#通过矩阵创建dataframe
obj_dataframe_series=pd.DataFrame([obj_series_1,obj_series_2])#通过series创建dataframe
obj_dataframe_dataframe=pd.DataFrame(obj_dataframe_series,index=[0,1,'one'],columns=[0,1,2,'a'])#通过其他dataframe创建dataframe
print "#通过字典创建dataframe"
print obj_dataframe_dict
print "#通过矩阵创建dataframe"
print obj_dataframe_array
print "#通过series创建dataframe"
print obj_dataframe_series
print "#通过其他dataframe创建dataframe"
print obj_dataframe_dataframe
#dataframe属性
print obj_dataframe_dataframe.dtypes
print obj_dataframe_dataframe.values
print obj_dataframe_dataframe.columns
print obj_dataframe_dataframe.index

运行结果

#通过字典创建dataframe
   a  b  c  d
0  1  2  3  4
1  2  3  4  5
#通过矩阵创建dataframe
     0  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值