文章目录
DataFrames的简单介绍及其创建
Dataframes相当于是Excel表格中的一个Sheet表,它有列名,行索引,还有每行都有若干个与表的列名对应的数据
使用Pandas的API可以从一个Excel文件或者CSV文件中读取某一个Sheet表,而这个Sheet表中的数据会被转化成DataFrames的结构。同理,当我们想使用Pandas库将我们格式化后的数据输出到一个Sheet表中(不论是Excel文件或是CSV文件)时,我们也要创建一个DataFrames的结构,将我们的数据以DataFrames的形式作为参数传递给Pandas的函数,让其将我们的数据持久化到文件中,因此,这就是我们学习DataFrames的原因
与创建DataFrames有关的3种数据结构
- 使用列表字典 ( { ‘column1’ : [‘d1’, ‘d2’, ‘d3’ …], ‘column2’ : [‘d1’, ‘d2’, ‘d3’ … ]… } )
- 使用字典列表 ( [ { ‘column1’ : ‘d1’, ‘column2’ : ‘d2’ }, { ‘column1’ : ‘d1’, ‘column2’ : ‘d2’ } … ] )
- 使用双层列表 ( [ [‘d1’, ‘d2’, ‘d3’], [‘d4’, ‘d5’, ‘d6’] … ] )
创建DataFrames的函数
- pandas.DataFrame( args… )
代码展示
# TODO 使用字典列表创建DataFrames
lists_dicts = list()
dic1 = {
'name':'name1', 'group':'group1'}
dic2 = {
'name':'name2', 'group':'group2'}
lists_dicts.append(dic1)
lists_dicts.append(dic2)
df = pd.DataFrame(lists_dicts)
'''
writer = pd.ExcelWriter('/Users/wong/Desktop/test.xlsx')
df.to_excel(writer, index=False)
writer.save()
writer.close()
'''
# TODO 使用列表字典创建DataFrames
dicts_lists = dict()
dicts_lists.setdefault('age', ['age1', 'age2'])
dicts_lists.setdefault('sex', ['sex1', 'sex2'])