Pandas(个人笔记)_bool序列-CSDN博客

本文链接：https://blog.csdn.net/ffffffgggdg/article/details/117670188

本文介绍了如何使用Python的numpy和Pandas库，重点讲解了Series类的对象创建、属性、方法，如isnull()和loc/iloc取值，以及DataFrame的创建、取值方式和常用操作。涵盖了数据结构、数据分析和数据处理的基础内容。

摘要由CSDN通过智能技术生成

import numpy as np,pandas as pd

(一般的,numpy包和Pandas包一起导入使用)

zip()把参数里的序列以类似字典的元组压缩起来

Series类对象

++pd.Series创建一个新对象(驼峰命名)++

Series(X,Y,Z)参数:
- X 是写入的数据一般为序列
- Y 是索引的数据可以写入序列默认为下标
- Z 是指定数据的类型
- X,Y可以用字典类型数据代替指定字典后再赋值索引参数可多可少缺省值用Nan代替(猜测原理为传字典时表已经创好是键值对应的, 再次赋值相当于表已经创好二次赋值,如果不传字典表没完成构建需要对应的键值对来创表所以必须对应 )
Series属性:
- index 表的下标属性返回一个下标组成的序列
- values 值属性返回一个序列与index的返回值都可以用下标获取
Series方法:
- isnull() 判断值是否为空返回一个bool序列
- notnull() 与上相反
- any() 判断bool序列是否有Turn 返回一个bool值
  np.isnan() 等同于Series的isnull()方法
Series 的遍历
- 与字典遍历类似

DateFrame

DataFrame的创建

data = {'city': ['北京', '北京', '北京', '上海', '上海', '上海'],
        'year': [2000, 2001, 2002, 2001, 2002, 2003],
        'population': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df = pd.DataFrame(data,['A', 'B', 'C', 'D', 'E', 'F'])
df
第一个参数为数据 一般为字典 键为列字段 值为列下的数据
#结果

	city	year	population
A	北京	2000	1.5
B	北京	2001	1.7
C	北京	2002	3.6
D	上海	2001	2.4
E	上海	2002	2.9
F	上海	2003	3.2

DataFrame的取值 loc[]和iloc[]
- loc[ X ] (类属性方法)里面传指定索引(可切片花式索引等)
- iloc [] loc方法的原本索引(数字)形式

df[['city','population']]
#结果
    city	population
A	北京	1.5
B	北京	1.7
C	北京	3.6
D	上海	2.4
E	上海	2.9
F	上海	3.2

df.iloc[1:4,2:4]
#结果
	population
B	1.7
C	3.6
D	2.4