项目要求:
获取相应的数据,分别为前三行和前四列。实现相应数据的查询
思路流程:
- 可以用到pd.DataFrame构造函数。该函数的参数解释:
- data: 数据源,可以是二维数组、字典、Series、另一 DataFrame、或者其他类似格式的对象。
- index: 行标签,默认为
None
,可以传入一组标签,用于指定 DataFrame 的行索引。 - columns: 列标签,默认为
None
,可以传入一组标签,用于指定 DataFrame 的列索引。 - dtype: 数据类型,默认为
None
,可以指定 DataFrame 中数据的类型。 - copy: 是否复制数据,默认为
False
,指定是否将传入的数据进行复制以创建 DataFrame。
该代码可以应用于二维数据的构造,以及二维数据的处理统计。
import pandas as pd
#假设employees是一个数据量足够大的数据框
def selectFirstRows(employees: pd.DataFrame) -> pd.DataFrame:
data=pd.DataFrame(employees,index=[0,1,2],columns=[0,1,2,3])#三行四列
return data
- 当然,我们可以简单一点,可以直接用 .lioc[] 切片法进行查询,该函数的参数用法:
df.iloc[<row indexer>, <column indexer>]: 可以组合行和列索引器来选择特定的行和列。
由此可见,三行四列的查询可以变为:
import pandas as pd
def selectFirstRows(employees: pd.DataFrame) -> pd.DataFrame:
#前开后闭,[0:3]不包括第三行
data=employees.iloc[0:3]
return data