Pandas DataFrame基础知识
1、加载数据集
导入Pandas库之后,可使用read_csv函数来加载CSV数据文件
import pandas as pd
# sep参数设为 \t, 显式指明使用制表符分隔
df = pd.read_csv('.../data/gapminder.tsv', sep='\t')
print(df.head())
输出前五行信息:
# 获取对象的类型
print(type(df))
# 获取行数和列数
print(df.shape)
# 获取列名
print(df.columns)
# 获取每列的dtype
print(df.dtypes)
# 获取更多数据信息
print(df.info())
2、查看列、行和单元格
"""获取列子集"""
country_df = df['country']
print(country_df.head()) # 显示前五行
print(country_df.tail()) # 显示最后五行
subset = df[['country'