数据分析pandas用法


1、Series的用法:一种类似与一维数组的对象,有一维数组组成以及与之相关的数据标签(索引)组成

#coding=utf-8

from pandas import Series, DataFrame
import pandas as pd
import numpy as np

obj = Series([4,38,5,2])
print obj
#数据
print obj.values
#索引(数据标签)
print obj.index

obj2 = Series([4,38,-5,2], index = ['a', 'b', 'c', 'd'])
print obj2
print obj2.values
print obj2.index
#大小
print obj2.shape
#筛选方式
print obj2[obj2>0]
#同乘
print obj2*2
#e的
print np.exp(obj2)
#查找返回bool值
print 'a' in obj2
print 's' in obj2

#字典-->Series
sdata = {'a':4, 'b':38, 'c':-5, 'd':2}
obj3 = Series(sdata)
#数据名
obj3.name = 'population'
#标签名
obj3.index.name  = 'state'
print obj3


#列表-->Series
states = ['s', 'a', 'b','c']
obj4 = Series(sdata, index=states)
#以标签为主键,缺失值为NaN
print obj4
#自动对齐索引值
print obj4+obj3

DataFrame是一种表格型的数据结构,它含有一组有序的列,每列可以是不同值的类型,DataFrame有行索引也有列索引。

#coding=utf-8

from pandas import Series, DataFrame

data = {'stata':['a', 'b', 'c', 'd'],
        'int':[1,2,3,4],
        'float':[0.2,0.4,0.8,1.0],
        'bool':[True, True, False, False]}
#自行改变顺序随机
print DataFrame(data)
#规定列顺序
print DataFrame(data, columns=['stata', 'int', 'float', 'bool'])

#规定列顺序和序号
frame = DataFrame(data, columns=['stata', 'int', 'float', 'bool', 'string'],
                index=['one', 'tow', 'three', 'four'])
print frame

#输出单一的列的两种形式
print frame['int']
print frame.float

#输出第三行
print frame.ix['three']

#规定新的一列,不存在的位NaN
frame['debt'] = 'xx'
print frame

#删除一列
del frame['string']
print frame

#转置
print frame.T

#表内容矩阵输出
print frame.values



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值