Python-Pandas(5)核心数据结构Series详解

原创 2017年08月13日 09:55:18
#Series (collection of values)
#DataFrame (collection of Series objects)
#Panel (collection of DataFrame objects)
#A Series object can hold many data types, including
#float - for representing float values
#int - for representing integer values
#bool - for representing Boolean values
#datetime64[ns] - for representing date & time, without time-zone
#datetime64[ns, tz] - for representing date & time, with time-zone
#timedelta[ns] - for representing differences in dates & times (seconds, minutes, etc.)
#category - for representing categorical values
#object - for representing String values

#FILM - film name
#RottenTomatoes - Rotten Tomatoes critics average score
#RottenTomatoes_User - Rotten Tomatoes user average score
#RT_norm - Rotten Tomatoes critics average score (normalized to a 0 to 5 point system)
#RT_user_norm - Rotten Tomatoes user average score (normalized to a 0 to 5 point system)
#Metacritic - Metacritic critics average score
#Metacritic_User - Metacritic user average score
import pandas as pd
fandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
print(series_film[0:5])
series_rt = fandango['RottenTomatoes']
print (series_rt[0:5])

这里写图片描述

# Import the Series object from pandas
from pandas import Series

film_names = series_film.values
#print type(film_names)
#print film_names
rt_scores = series_rt.values
#print rt_scores
series_custom = Series(rt_scores , index=film_names)
series_custom[['Minions (2015)', 'Leviathan (2014)']]

这里写图片描述

# int index is also aviable
series_custom = Series(rt_scores , index=film_names)
series_custom[['Minions (2015)', 'Leviathan (2014)']]
fiveten = series_custom[5:10]
print(fiveten)

这里写图片描述

original_index = series_custom.index.tolist()
#print original_index
sorted_index = sorted(original_index)
sorted_by_index = series_custom.reindex(sorted_index)
#print sorted_by_index

这里写图片描述

sc2 = series_custom.sort_index()
sc3 = series_custom.sort_values()
#print(sc2[0:10])
print(sc3[0:10])

这里写图片描述

#The values in a Series object are treated as an ndarray, the core data type in NumPy
import numpy as np
# Add each value with each other
print np.add(series_custom, series_custom)
# Apply sine function to each value
np.sin(series_custom)
# Return the highest value (will return a single value not a Series)
np.max(series_custom)

这里写图片描述

#will actually return a Series object with a boolean value for each film
series_custom > 50
series_greater_than_50 = series_custom[series_custom > 50]

criteria_one = series_custom > 50
criteria_two = series_custom < 75
both_criteria = series_custom[criteria_one & criteria_two]
print both_criteria

这里写图片描述

#data alignment same index
rt_critics = Series(fandango['RottenTomatoes'].values, index=fandango['FILM'])
rt_users = Series(fandango['RottenTomatoes_User'].values, index=fandango['FILM'])
rt_mean = (rt_critics + rt_users)/2

print(rt_mean)

这里写图片描述

版权声明:本文为博主原创文章,未经博主允许不得转载。

pandas核心数据结构series详解

import pandas as pd from pandas import Series import numpy as np fandango = pd.read_csv('fandango_s...
  • qq_32005671
  • qq_32005671
  • 2017年03月13日 20:17
  • 156

Pandas两种主要的数据结构--Series和DataFrame

(1)Series Series是一种类似与一维数组的对象,它由一组数据以及一组与之相关的数据便签(即索引)组成,仅由一组数据即可产生最简单的Series。 例如:a=Series([9,-3...
  • Lin_disguiser
  • Lin_disguiser
  • 2017年03月08日 16:54
  • 434

Pandas基础 -- 1. 数据结构 Series

常用命名:from pandas import Series, DataFrame import pandas as pdSeries是一种类似于一维数组的对象: 它由一组数组(各种NumPy数据类...
  • lwbeyond
  • lwbeyond
  • 2017年03月28日 17:10
  • 612

Python Pandas常用数据结构Series和DataFrame的相关操作

Pandas是基于Numpy构建的,包含多种高级数据结构和工具的数据分析包。Pandas中常用的数据结构有Series和DataFrame。主要介绍DataFrame的定义和数据处理中的切片操作。...
  • haha_point
  • haha_point
  • 2017年09月09日 19:29
  • 190

hibernate核心配置文件详解

核心配置文件详解 Hibernate.cfg.xml:
  • CSDN_GIA
  • CSDN_GIA
  • 2017年01月22日 15:47
  • 443

pandas基础: Series和DataFrame的简单介绍

原文链接: https://www.cnblogs.com/sirkevin/p/5741853.html 一、pandas 是什么 pandas 是基于 NumPy 的一个 P...
  • wanglingli95
  • wanglingli95
  • 2017年12月24日 22:38
  • 45

tomcat 解析(五)-Tomcat的核心组成和启动过程

声明:源码版本为Tomcat 6.0.35 前面的文章中介绍了Tomcat的基本配置,每个配置项也基本上对应了Tomcat的组件结构,如果要用一张图来形象展现一下Tomcat组成的话,整个Tom...
  • u014044812
  • u014044812
  • 2016年06月23日 18:56
  • 967

Linux内核数据结构分析

上一篇在分析Linux虚拟文件系统的过程中,我注意到了一个反复出现的数据结构——struct list_head,通过名称就可以确定这是一种链表数据结构,今天我们就以此为切入点,对内核数据结构的特点做...
  • u012927281
  • u012927281
  • 2016年07月06日 23:18
  • 586

数据结构基础知识核心归纳(一)

堆是一种树状的数据结构。一般由程序员分配释放,存放由new创建的对象和数组(C中是由malloc分配和free释放),JVM不定时查看这个对象,如果没有引用指向这个对象就回收.1)优点:可动态分配内存...
  • AndrExpert
  • AndrExpert
  • 2017年09月09日 09:56
  • 929

Echarts数据可视化series-bar柱形图详解,开发全解+完美注释

mytextStyle={ color:"#333",//文字颜色 fontStyle:"normal",//italic斜体 oblique倾斜 fontWeight:"n...
  • luanpeng825485697
  • luanpeng825485697
  • 2017年08月07日 12:21
  • 2446
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Python-Pandas(5)核心数据结构Series详解
举报原因:
原因补充:

(最多只允许输入30个字)