pandas基本操作
一、导入包
import pandas as pd
二、创建 DataFrame
DataFrame是一种表格型结构,含有一组有序的列,每一列可以是不同的数据类型。既有行索引,又有列索引。
2.1 创建简单的DataFrame
代码:
pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]})
输出结果:
2.2 创建值为字符串的DataFrame
代码:
pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 'Sue': ['Pretty good.', 'Bland.']})
输出结果:
2.3 DataFrame加入行索引
字典列表构造函数给列标签赋值,但只对行标签使用从0(0,1,2,3,…)升序计数。有时这是可以的,但通常我们想自己分配这些标签。
DataFrame中使用的 index 为索引,可以在构造函数中使用索引形参给它赋值。
代码:
pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'],
'Sue': ['Pretty good.', 'Bland.']},
index=['Product A', 'Product B'])
输出结果:
2.4 DataFrame加入列索引
由二维列表构造DataFrameshi时,通过 columns 和 index 分别加入列和行索引。
代码:
pd.DataFrame([['I liked it.', 'It was awful.'],
['Pretty good.', 'Bland.']],
index=['Product A', 'Product B'],
columns=['Bob', 'Sue'])
输出结果:
三、创建 Series
Series是一种类似于以为NumPy数组的对象,它由一组数据(各种NumPy数据类型)和与之相关的一组数据标签(即索引)组成的。可以用index和values分别规定索引和值。如果不规定索引,会自动创建 0 到 N-1 索引。
3.1 简单创建 Series
只需要一个列表就可以创建一个Series。
代码:
pd.Series([1, 2, 3, 4, 5])
输出结果:
3.2 创建带行名的 Series
一个Series本质上是一个DataFrame的一列。因此,可以像以前一样使用索引参数为Series分配列值。但是,Series没有列名,它只有一个整体名称.
代码:
pd.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'], name='Product A')
输出结果: