DataFrame使用笔记

	dates=pd.date_range('20160728',periods=6) #创建固定频度的时间序列
	df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) #创建6*4的随机数,索引,列名称。
	df2=pd.DataFrame({'A':pd.Timestamp('20160728'),'B':pd.Series(1)})#字典创建Dataframe,假如字典的数据长度不同,以最长的数据为	准。
	df2.dtypes #查看各行的数据格式  
	df2.head()  df2.tail(5) #查看前、后几列
	df.columns  df.value #查看列名、value
	df.describe() #查看描述性的统计,比如每一列的count、mean、std...
	df.T  df.sort(columns='C') #转秩、排序
	df['A']   df[1:3]#选择A列数据,选择1-2行数据,切片操作得到的是行数据。
	df.loc[:,['A','B']] #选择多列数据
	df.loc['20160728':'20160730',['A','B']] #选择局部区域
	df.at[dates[0],'A'] #选择某个值
	df.iloc[3]  df.iloc[1,1]#提取第四行数据,取第2行第2列的这个数
	df.iloc[3:5,0:2] #像array一样切片操作
	df.iloc[[1,2,4],[0,2]] #提取不连续的行和列
	df.iat[1,1]#专门取某个数,效率比较高
	df[(df.D>0)&(df.C<0)] #选择D列数据大于0的行
	df[['A','B']][(df.D>0)&(df.C<0)]#选择D列数据大于0的行,只返回A,B两列
	df['D'].isin(alist)#alist是一个预先定义的列表,把要筛选的值写到列表中,查找D数据中含有alist的值
	os.getcwd()#获得当前的工作目录
	df=pd.read_csv('',encoding='gbk',sep=',')#读取csv文件
	counts=df[u'专业名称'].value_counts() #计数统计
	plt=counts.plot(kind='bar').get_figure()
	plt.savefig('d/plot.png')  #画图
	good=df[df[u'高考分数']>520] #筛选
	good_counts=good[u'专业名称'].value_counts()
	per=good_counts/counts #计算百分比,直接利用矩阵的除法
	df.groupby('A').first() #按A列分组,输出每一组的第一行数据
	df.groupby(['A','B']) #按两列分组
	#创建函数,作为分组标准。 下例:如果列名是abem中的之一,就分为组别v反之为w
	def get_type(letter):
	    if letter.lower() in 'abem':
	       return 'v'
	    else:
	       return 'w'
	grouped=df.groupby(get_type,axis=1)
	
	import pandas.util.testing as tm
	colors=tm.choice(['red','green'],size=10)
	foods=tm.choice(['eggs','ham'],size=10) #随机创建两个数组
	index=pd.MultiIndex.from.arrays([colors,foods],names=['color','food'])  #创建MultiIndex对象,然后创建DataFrame对象
	df.pd.DataFrame(np.random.randn(10,2),index=index)
	print df.query('color=="red"') #查询
	grouped=df.groupby(level='food')#在分组中使用索引
	df.index.names=[None,None]
	print df.query('ilevel_0=="red"')#删除了索引名称,只能使用ilevel_0表示第一个索引


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值