python pandas 应用系列

pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包

pandas 是围绕着 Series 和 DataFrame 两个核心数据结构展开的 

一、导入相关包:

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
from pandas import Series,DataFrame

二、创建对象:

(一)

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
from pandas import Series,DataFrame
s = Series([1,3,5,7])
print s
可以传递一个list进入Serise , 默认创建整形,并且创建的时候会返回一个dtype:在这里就是int64

PS:如果list中有其他的数据类型,则会返回 object类型(多种数据类型;


(二)

Series允许传递index(左侧下标) 和 value (右侧下标),这里就和字典一样,不过value的表达是data

import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
from pandas import Series,DataFrame
s = Series(index = ['a','b','c'] , data= [1,3,5])
print s

并且可以使用 s.index 和 s.values 来查询 , 这里是一一对应关系,但是又是相互独立的narray。

PS:Serise 还有name 属性, 可以定义 s.name 和 s.index.name , eg ---> s.name = 'a_series'


(三)

DataFrame是一个表格型的数据结构,它含有一组有序的列(类似于 index),每列可以是不同的值类型(不像 ndarray 只能有一个 dtype)。

基本上可以把 DataFrame 看成是共享同一个 index 的 Series 的集合。

DataFrame 的构造方法与 Series 类似,只不过可以同时接受多条一维数据源,每一条都会成为单独的一列:

import numpy as np   
import pandas as pd   
import matplotlib.pyplot as plt  
from pandas import Series,DataFrame 
data = {'state':['china','china','china','japan','japan'] , 'year':['2012','2012','2013','2014','2015'],'pop':['1.5','1.6','1.7','1.8','1.9']}
df = DataFrame(data)


并且对于上述操作:

DataFrame(data=None,index=None,coloumns=None),coloumns就是name , 并且index可以修改左侧顺序的名称。

cloumns可以修改上面name的先后顺序,并且让权值对齐;

df = DataFrame(data,index = ['one','two','three','four','five'],columns=['year','pop','state','love'])


并且如果想提取出某一列的话,就对其进行如同C语言结构体的操作即可, 

df.state


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Kelisita

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值