python之Pandas库——数据结构初识

标签: Pandas
66人阅读 评论(0) 收藏 举报
分类:

一、关于pandas

    pandas里面的两大数据结构Series和Dataframe。

    Series类似于有索引一维数组的对象,与值不同的是,它多了一个标签,所以可以根据标签取数据。同时,可以将Series看作是一个有序的字典。

    Dataframe 是一个表格型的数据结构,含有一个有序的列,不同的列的数据结构可以不一样,同一列的数据类型可以是一样的。



二、Series一些常见操作

import numpy as np
import pandas as pd
import sys
from pandas import Series, DataFrame

obj = Series([4, 7, -5, 3])
obj
Out[129]:
0    4
1    7
2   -5
3    3
dtype: int64
In [130]:


obj.values
Out[130]:
array([ 4,  7, -5,  3], dtype=int64)
In [131]:

obj.index#获取索引值
Out[131]:
RangeIndex(start=0, stop=4, step=1)
In [132]:


obj2 = Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])
obj2
Out[132]:
d    4
b    7
a   -5
c    3
dtype: int64
In [133]:


obj2.index
Out[133]:
Index(['d', 'b', 'a', 'c'], dtype='object')
In [134]:


obj2['a']#根据索引获取对应的值
Out[134]:
-5
In [135]:


obj2['d'] = 6
obj2[['c', 'a', 'd']]
Out[135]:
c    3
a   -5
d    6
dtype: int64
In [136]:


obj2[obj2 > 0]
Out[136]:
d    6
b    7
c    3
dtype: int64
In [137]:


obj2 * 2
Out[137]:
d    12
b    14
a   -10
c     6
dtype: int64
In [138]:


np.exp(obj2)
Out[138]:
d     403.428793
b    1096.633158
a       0.006738
c      20.085537
dtype: float64
In [139]:


#索引在不在series索引值中
'b' in obj2#索引在不在series索引值中
Out[139]:
True
In [140]:


#通过字典创建series
sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
obj3 = Series(sdata)
obj3
Out[140]:
Ohio      35000
Oregon    16000
Texas     71000
Utah       5000
dtype: int64
In [141]:


states = ['California', 'Ohio', 'Oregon', 'Texas']
obj4 = Series(sdata, index=states)
obj4
Out[141]:
California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
dtype: float64
In [142]:


pd.isnull(obj4)#检测确实值
Out[142]:
California     True
Ohio          False
Oregon        False
Texas         False
dtype: bool
In [143]:


pd.notnull(obj4)
Out[143]:
California    False
Ohio           True
Oregon         True
Texas          True
dtype: bool
In [144]:


obj3 
Out[144]:
Ohio      35000
Oregon    16000
Texas     71000
Utah       5000
dtype: int64
In [145]:


obj4
Out[145]:
California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
dtype: float64
In [146]:


obj3 + obj4
Out[146]:
California         NaN
Ohio           70000.0
Oregon         32000.0
Texas         142000.0
Utah               NaN
dtype: float64
In [147]:


obj4.name = 'population'
obj4.index.name = 'state'
obj4
Out[147]:
state
California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
Name: population, dtype: float64
In [148]:


#通赋值修改索引值
obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']
obj
Out[148]:
Bob      4
Steve    7
Jeff    -5
Ryan     3
dtype: int64
In [ ]:

三、Dataframe常见操作


查看评论

pandas库简介(1)--pandas的三种数据结构

/****************持续更新中**************************/ pandas有三种数据结构形式,分别是Series,DataFrame和索引对象。 1.Serie...
  • zby1001
  • zby1001
  • 2017-01-08 17:22:01
  • 1854

python数据分析pandas包入门学习(一)pandas数据结构介绍

本文参考《利用python进行数据分析》的第五章 pandas入门 1 pandas数据结构介绍 pandas有两种主要的数据结构:series和DataFrame Series:一种类似于一维数组...
  • helen1313
  • helen1313
  • 2016-11-16 15:24:55
  • 2360

利用python进行数据分析——之数据结构pandas(一)

Series Dataframe 广播 pandas对象上的所有描述统计都排除了缺失数据 1、pandas的文件读写函数 1.1、read_csv()函数。用于读取csv文件的函数:df=read_c...
  • u014380165
  • u014380165
  • 2017-03-30 14:34:05
  • 1977

Python 中的Pandas库

待总结 用scikit-learn和pandas学习线性回归 用scikit-learn和pandas学习Ridge回归 基于python的数据分析库Pandas pa...
  • jiandanjinxin
  • jiandanjinxin
  • 2017-04-27 00:37:31
  • 1505

Python数据分析库pandas基本操作

Python数据分析库pandas基本操作
  • u012269327
  • u012269327
  • 2017-02-20 17:09:06
  • 14809

Python Pandas常用数据结构Series和DataFrame的相关操作

Pandas是基于Numpy构建的,包含多种高级数据结构和工具的数据分析包。Pandas中常用的数据结构有Series和DataFrame。主要介绍DataFrame的定义和数据处理中的切片操作。...
  • haha_point
  • haha_point
  • 2017-09-09 19:29:50
  • 325

Windows下如何安装Python的库文件(以pandas)

虽然装的双系统,但是频繁切换也很不爽,所以想在Windows上也建一个Python环境,以下演示如何在Windows 下安装Python的依赖库。 1.安装Python 此步略过,安装依赖库的前提...
  • lwgkzl
  • lwgkzl
  • 2018-01-06 10:12:20
  • 278

python机器学习库入门之pandas

pandas
  • xishisugan
  • xishisugan
  • 2017-02-12 23:56:38
  • 1091

pandas与numpy数据结构

Pandas是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发tea...
  • Bruce_0712
  • Bruce_0712
  • 2018-02-10 20:22:26
  • 159

python中pandas库学习笔记

现在回想学pandas很意外,记得五月份的时候刚刚跑到现在的公司实习,那个时候公司没发电脑,当时天天去那就看书(自己的电脑被朋友拿走了),就这样看了半个月的pandas,后来也就慢慢用上了,下面是pa...
  • luoyexuge
  • luoyexuge
  • 2015-10-13 21:19:20
  • 9415
    个人资料
    专栏达人 持之以恒
    等级:
    访问量: 10万+
    积分: 2321
    排名: 1万+
    博客专栏
    最新评论