pandas是当前最流行的python数据分析处理的工具,dataframe是pandas最常用的数据对象,生成dataframe通常的方法通常为:
1、文件读取
使用read()方法,读取各种csv、excel、html、json等文件;
2、连接数据库,通过ORM查询读取
pandas配套的ORM为SQLAlchemy,
那用pyDAL可以吗?当然可以
3、手工生成dataframe
dataframe除了上述两种方法,其实也可以通过构造数据生成,其中“字典组成的列表”方法是最常用生成dataframe最常用方法:
原始数据 由字典组成一个列表,每个字典是一行数据,示例如下:
# 定义一个字典列表
data = [{'x': 1, 'y': 2}, {'x': 3, 'y': 4, 'z': 5}]
# 生成DataFrame对象
df = pd.DataFrame(data)
4、pyDAL与pandas
对于pyDAL,对于查询结果刚好用as_list()方法转化得到数据,就是一个“字典组成的列表”的数据结构,示例如下:
df = pd.DataFrame( db(db.mytable).select().as_list() )
这样mytable整张表就读取到了df中,我们后续就可以用df来做各种数据操作了;