Pandas学习笔记（1）

最新推荐文章于 2024-04-23 22:17:34 发布

VictorYao_117

最新推荐文章于 2024-04-23 22:17:34 发布

阅读量2.3k

点赞数

分类专栏： Pandas 文章标签： Pandas 数据结构

本文链接：https://blog.csdn.net/xiaoqi0531/article/details/52998026

版权

一、Pandas的数据结构介绍
>>> from pandas import Series,DataFrame
>>> import pandas as pd
>>> import numpy as np
1.Series
Series：类似于一维数组的对象，由一组数据（各种numpy的数据类型）以及一组与之相关的数据标签（即索引）组成
>>> obj=Series([1,2,3,4])
#如果不指定索引，会自动生成从0-(N-1)的整数型索引
>>> obj
0 1
1 2
2 3
3 4
dtype: int64
>>> obj.values
array([1, 2, 3, 4])
>>> obj.index
RangeIndex(start=0, stop=4, step=1)
#numpy数组运算保留索引和值之间的关系
>>> obj[obj>2]
2 3
3 4
dtype: int64
>>> obj*2
0 2
1 4
2 6
3 8
dtype: int64
>>> np.exp(obj)
0 2.718282
1 7.389056
2 20.085537
3 54.598150
dtype: float64
#如果数据被存放在有一个python字典中，也可以直接通过这个字典创建Series
>>> score={"Tom":99,"Lucy":90,"John":80,"Green":58}
>>> score
{'John': 80, 'Green': 58, 'Lucy': 90, 'Tom': 99}
>>> obj_score=Series(score)
>>> obj_score
Green 58
John 80
Lucy 90
Tom 99
dtype: int64
#Series可以被看成是一个定长的有序字典，可以用很多原本需要字典参数的函数
>>> "Green" in obj_score
True
>>> "yaoxq" in obj_score
False
#将一个字典传入Series的索引，就可以得到匹配的值，“NaN”表示缺失或者NA值。
>>> name={"A","B","C","Tom"}
>>> obj_score_new=Series(obj_score,index=name)
>>> obj_score_new
A NaN
C NaN
B NaN
Tom 99.0
dtype: float64
#我们可以使用isnull和isnotnull来检测缺失数据
>>> pd.isnull(obj_score)
Green False

最低0.47元/天解锁文章

VictorYao_117

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Pandas学习笔记（1）

一、Pandas的数据结构介绍>>> from pandas import Series,DataFrame>>> import pandas as pd>>> import numpy as np1.SeriesSeries：类似于一维数组的对象，由一组数据（各种numpy的数据类型）以及一组与之相关的数据标签（即索引）组成>>> obj=Series([1,2,3,4]
复制链接

扫一扫