//此文档的目的是帮助更多初学Python的Programmers少造轮子,致力于顺藤摸瓜。因水平所限,如有缺漏以及不严谨之处,请各位多多指教。
//任何人都可以轻而易举地掌握DataFrame。你所需要的只是一个脑子,和有记事本程序的电脑。
什么是DataFrame?
首先给出官网的定义,是不是有点眼熟?
没错,它就是来源于大名鼎鼎pandas库的内建方法。
首先我们先搞清楚它是做什么的?在入门阶段,我们简单把它理解为一个表格型数据结构。
它含有一组有序的index,大致可看成共享同一个index的series集合。
>>> d = {'col1': [1, 2], 'col2': [3, 4]}
>>> df = pd.DataFrame(data=d)
>>> df
col1 col2
0 1 3
1 2 4
data : numpy数组,字典或DataFrame
字典可以包括序列,数组,或长得像列表的元素。
index : 数组的列标,如上:[0,1]
如果未指定下标,则采用默认下标。
columns : 数组的行标,如上:[col1,col2]
如果未指定行标,则采用默认行标。
dtype : 强制性数据类型
只能有一种哦,也可以空着。
copy : 布尔值,默认情况下是FALSE
Copy data from inputs. Only affects DataFrame / 2d ndarray input
到这里,你就已经入门了!但如果你想继续了解一些属性,看下面吧:
T |
转置索引和列。 |
at |
访问行/列标签对的单个值。 |
axes |
返回表示DataFrame轴的列表。 |
blocks |
(已弃用)as_blocks()的内部属性,属性同义词 |
columns |
DataFrame的列标签。 |