import pandas as pd
import numpy as np
from pandas import Series,DataFrame
data = {'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
'year':[2000,2001,2002,2001,2002],
'pop':[1.5,1.7,3.6,2.4,2.9]}
frame = DataFrame(data)
frame #可以把字典,等长的列表转换成一个 dataframe dataframe有行索引也有列的索引
DataFrame(data,columns=['year','state','pop']) #指定列的顺序,DataFrame就会按照指定的顺序进行排列
frame2 = DataFrame(data,columns=['year','state','pop','debt'],
index=['one','two','three','four','five'])
frame2 # 如果列找不到就会返回一个NAN 这里同样的可以将1~N-1的索引改成指定索引
frame2.columns # 返回列的信息
frame2['state'] #通过字典标记方式可以将dataframe的列获取为一个Series
frame2.year # 同上
frame2['state'].name # 返回的Series的name属性也是设置好的
frame2['state'].index.name
frame2.ix['three'] # 行可以通过为止
利用Python数据分析:pandas入门(二)
最新推荐文章于 2024-05-23 15:12:49 发布
这篇博客介绍了如何使用Python的pandas库创建和操作DataFrame。内容包括从字典创建DataFrame,指定列顺序,设置索引,获取和设置列,删除列,布尔索引,以及DataFrame的转置和数值数据的获取。示例展示了如何处理缺失值,以及如何通过嵌套字典创建DataFrame,并设置了索引和列的名称。
摘要由CSDN通过智能技术生成