一、概述
本文主要记录一些常用的pandas 操作示例, 可收藏用作日常编码中的速查手册。
用到的示例可以在下面的索引分类中找到。
二、目录
三、示例
注:以下示例部分参考《利用python进行数据分析》一书
1. pandas 创建 Series
Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。
Series的字符串表现形式为:索引在左边,值在右边。
通过 list 创建 series
通过 list 创建 series不指定索引时候,索引自动生成
from pandas import Series
list_data = [4, 7, -5, 3]
series_data = Series(list_data )
通过 dict 创建 Series
此种情况下,字典的key为series的索引值
from pandas import Series
dict_data = {
'Ohio': 35000, 'Oregon': 16000, 'Utah': 5000}
series_data = Series(dict_data )
通过 DataFrame 获取 Series
通过DataFrame 获取某一行、某一列,等到的返回结果是series
from pandas import Series,DataFrame
data = {
'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
'year': [2000, 2001, 2002, 2001, 2002],
'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame = DataFrame(data)
series_data = frame['state']
创建 series 时候指定索引
通过index指定索引, 生成出来的索引带顺序
from pandas import Series
dict_data = [35000,16000,5000]
series_data = Series(dict_data , index = [ 'Ohio','Oregon','Utah' ])
2. pandas 创建 DataFrame
DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。
DataFrame既有行索引(index)也有列索引(columns)
通过字典创建 DataFrame
key会变成列索引,key里边的值成为列里边的数据,行索引没有指定的话会由pandas自动生成
from pandas import DataFrame
data = {
'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],
'year': [2000, 2001