pandas随笔

DataFrame

import pandas as pd

area_dict = {'California':423967,'Texas':695662,'New York':141297}
population_dict = {'California':1.3, 'Texas':0.98, 'New York':1.13}
area = pd.Series(area_dict)
population = pd.Series(population_dict)
states_df = pd.DataFrame({'area':area,'population':population})
print(states_df.index)
print(states_df.columns)

data.describe() #基本统计量

count 195.000000 #数量
mean 2744.595385 #均值
std 424.739407 #标准差
min 865.000000 #最小值
25% 2460.600000 #下四分位
50% 2655.900000 #中位数
75% 3023.200000 #上四分位
max 4065.200000 #最大值

range 3200.200000 #极差max-min
var 0.154755 #变异系数 std/mean

dis 562.600000 #四分位间距 75%-25%

import pandas as pd

area = pd.Series({'California':423967,'Texas':695662,
                  'New York':141297,'Floriade':170312,
                  'Illinois':149995})

pop = pd.Series({'California':38332521,'Texas':26448193,
                  'New York':19651127,'Floriade':19552860,
                  'Illinois':12882135})
data = pd.DataFrame({'area':area, 'pop':pop})
data['density'] = data['pop'] / data['area']
print(data.values)
print(data.values[2])
print(data.values[1][1])
print(data.values[2:][:1])#第一个参数表示从哪一行开始,第二个参数表示输出几行。跟平常不一样
#iloc索引
print(data.iloc[:2,1:2])#切片,行列索引默认显示,数据1 2 行 1列。
#loc索引(左右都取)
print(data.loc[:'Floriade', 'area':'pop'])
#ix索引(混合)
print(data.ix[:3, 'area':'pop'])
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值