pandas是在NumPy基础上构建的,NumPy的一些通用函数也可以在pandas上使用。DataFrame类用来管理具有索引和标签的数据,这些数据与来自SQL数据表或电子表格(例如Excel)的数据没有太多不同。以下介绍几种创建DataFrame的方法。
1、通过数组创建,代码如下:
1.1. 一维数组创建代码:
# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd
df = pd.DataFrame([10,20,30,40], columns=['numbers'], index=['a','b','c','d'])
print(df)
运行结果如下:
numbers
a 10
b 20
c 30
d 40
Process finished with exit code 0
数据:[10,20,30,40]
数据可以用不同组成或类型提供(列表,元组,ndarray,字典对象都是候选者)
标签:columns=['numbers']
数据组织为列,可以自定义列名
索引:index=['a','b','c','d']
索引可以采用不同的格式(数值,字符串,时间信息)
1.2. 二维数组创建代码:
df = pd.DataFrame(data=[[10,20],[30,40],[50,60],[70,80]], columns=['numbers','floats'], index=['a','b','c','d'])
print(df)
运行结果:
numbers floats
a 10 20
b 30 40
c 50 60
d 70 80
1.3字典组成的列表创建代码:
#字典组成的列表
data = [{'no1':1,'no2':2}, {'no1':3, 'no2':4,'no3':5}]
df = pd.DataFrame(data)
print(df)
运行结果:
no1 no2 no3
0 1 2 NaN
1 3 4 5.0
2、通过字典创建
2.1. 数组组成的字典创建代码:
#通过字典创建:
data = {'one':[1,2,3,4],'two':[5,6,7,8]}
df = pd.DataFrame(data)
print(df)
运行结果:
one two
0 1 5
1 2 6
2 3 7
3 4 8
2.2. series组成的字典创建代码:
# series组成的字典
data = {'one':pd.Series(['a','b','c','d']), 'two':pd.Series([1,2,3,4])}
df = pd.DataFrame(data)
print(df)
运行结果:
one two
0 a 1
1 b 2
2 c 3
3 d 4
2.3. 字典组成的字典创建代码:
#字典的字典
data = {'a1':{'b1':1,'b2':2,'b3':3},'a2':{'b1':4,'b2':5,'b3':6}}
df = pd.DataFrame(data)
print(df)
运行结果:
a1 a2
b1 1 4
b2 2 5
b3 3 6