DataFrame对象的使用
创建
接收一个字典
In [1]: import pandas as pd
In [2]: dic1 = {
"name": ["张三", "李四"], "age": [22, 18], "gender": ["男", "女"]}
In [3]: df1 = pd.DataFrame(dic1)
In [4]: df1
Out[4]:
name age gender
0 张三 22 男
1 李四 18 女
-
当接受一个字典作为参数时, 字典的keys会作为表格的列标签, 表格的记录索引index (也就是横标签) 默认从0开始自增, keys对应的values会在相应的列标签下排成一列
-
字典中至少有一个key对应的value是列表, 并且所有出现的列表都必须是相同长度
In [5]: dic1_test = { "name": "张三", "age": 22, "gender": "男"} In [6]: df1_test = pd.DataFrame(dic1_test) ValueError: If using all scalar values, you must pass an index In [7]: dic1_test2 = { "name": ["张三", "李四"], "age": 22, "gender": ["男"]} In [8]: df1_test2 = pd.DataFrame(dic1_test2) ValueError: arrays must all be same length
-
表格的index(也就是行数)默认是列表的长度, 如果字典的values中没有列表, 则必须人为指定index
-
index 是一个列表类型, 里面存放行标签, 标量的values会被自动重复相应的次数(列表的长度)
In [10]: df1_test3 = pd.DataFrame(dic1_test, index=["a", 1, [1]]) In [11]: df1_test3 Out[11]: name age gender a 张三 22 男 1 张三 22 男 [1]</
-