DataFrame 是一个表格型的数据结构(数据框),它含有一组有序的列,每列可以是不同的数据类型。
DataFrame 既有行索引,也有列索引,可以看作是由多个Series索引组成的字典(共用一个索引),数据是以二维结构存放的。
索引:是指有序列表中的位置。
Python字符串可以看作是字符列表;
每个字符都有一个从零(开始)到长度减一(结束)的索引。
对于字符串“Python”,索引按如下方式分解:
P y t h o n
0 1 2 3 4 5
此外,Python支持负索引,在这种情况下,它从末尾开始计算。最后一个字符的索引为-1,倒数第二个字符的索引为-2,等等:
1. DataFrame索引的创建
字典类:
- 数组、列表或元组构成的字典构造 DataFrame
- Series构成的字典构造 DataFrame
- 字典构成的字典构造 DataFrame
列表类:
- 2D ndarray 构造 DataFrame
- Series构成的列表构造 DataFrame
- 字典构成的列表构造 DataFrame
>>> import numpy as np
>>> import pandas as pd
1.1 字典类构造DataFrame
1.1.1 数组,列表或元组构成的字典构造DataFrame
**注意:**数组,列表或元组的元素个数要相同,否则报错
>>> dict = {
'a':[1,2,3,4], 'b':(5,