python之pandas库

1、导入库

import pandas as pd
from pandas import Series as sr
from pandas import DataFrame as df

2、数据结构Series、DataFrame

# Series 是一种类似一维数组的对像。
obj = sr([4, 6, -3, 0]) # 生成Series
obj.values # 获取Series值
obj.index # 获取Series索引
obj1 = sr([4,7,5,-1], index=['a','b','c','d']) # 自己设置索引
obj1['a']; obj1[['c','b']] # 通过索引获取值
obj1[obj1 > 4];obj1*2; # 数组运算
# 可将Series看成定长的字典,索引到值的一个映射。
# NAN表示非数字或缺失值
pd.isnull(obj1);pd.notnull(obj1) # pandas检测缺失数据
obj1.isnull() # Series 检测 
# Series一个重要功能是:它在运算中自动对齐不同索引的数据
# Series对象本身及其索引都有一个name属性

---------------------------------------------------------
# DataFrame 是一个表格型的数据结构
data = {'state':['Ohi','ever','heva','ssar'],
        'year':[2000,2001,2002,2003],
        'pop':[1.5,1.7,2.4,3.2]}
frame = df(data)
# df 会自动加上索引,列会被有序排列
df(data,columns=['year','pop','state']) # 你可以指定顺序
frame['state'];frame.year # 将df的列获取成为Series
frame['eastern']=frame.state=='Ohi' # 为不存在的列赋值会产生新列
del frame['eastern'] # 使用del删除
# Warming:通过索引返回的列是数据的视图,不是副本。如若对其修改会反映到源df上去。 使用copy方法可以进行复制
# 嵌套字典传给df,会被解释成:外层字典的键作为列,内层键作为行索引。

3、基本功能

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值