【基础知识】pandas入门

两种:一维数组型的Series对象+二维表格型的DataFrame对象

andas的索引对象index是不可变的,因此用户不能对其进行修改。
但index中可以包含重复的标签。选择重复的标签,会显示所有的结果。

目录

一、Series对象

1、Series对象创建(4种)

(1)Numpy的一维ndarray数组

(2)标量值创建

(3)字典创建

(4)列表创建

2、Series对象的基本运算

3、基本功能

二、DataFrame对象

1、DataFrame对象创建

(1)字典

(2)嵌套列表

 (3)字典

2、DateFrame对象属性

2、DataFrame基本运算

(1)数据筛选

 (2)数据预处理

(3)数据运算+排序

 (4)数学统计

 (5)数据分组和聚合

三、pandas数据可视化


一、Series对象

只能存储同一数据类型的数据 结构:index+values

a.values()   #查看
a.index()
a.shape   #Series对象的形状
a.name='grade'     #name属性为对象&索引命名
a.index.name='科目'  
a[1]   #查看 切片
a[0:2]
a[['a','b','c']]
a[a>=90]   #筛选

a.isnull()   #isnull()检测是否为空值

1、Series对象创建(4种)

(1)Numpy的一维ndarray数组

import pandas as pd
import numpy as np
a=pd.Series(np.arange(0,5,2),index=['a','b','c'])
a

(2)标量值创建

b=pd.Series(25,index=['a','b','c'])
b

(3)字典创建

dict1={'a':1,'b':2,'c':3}
a=pd.Series(dict1)
a

(4)列表创建

b=pd.Series(data=[4,7,-5,3],index=['d','a','b','c'])
b

2、Series对象的基本运算

a=pd.Series(data=[90,86,95],index=['java','c','python'])
a+2  #整个a的值都加2
np.sqrt(a)  #a的值的平方根
np.exp(a)   #e的x幂次方根
a.count()   #计数
a.drop(index=['java','c']) 

#Series间的计算
a=pd.Series([1,2,3],index=['a','b','c'])
b=pd.Series([2,4],index=['b','c'])
a+b
#在将数据相加时,若存在不同的索引对,则结果的索引就是该索引对的并集。
a    NaN
b    4.0
c    7.0
dtype: float64

3、基本功能

# 重新索引
a=pd.Series([4,6,3,5],index=['c','d','a','e'])
a1=obj.reindex(['a','b','c','d','e'])    
a1       
#reindex将会根据新索引进行重排,若某个索引值当前不存在,就引入缺失值。
a    3.0
b    NaN
c    4.0
d    6.0
e    5.0
dtype: float64

 

二、DataFrame对象

一个表格型的数据结构,含有一组有序的列。 既有行索引也有列索引。

每列可以是不同的值类型(数值、字符串、布尔值等)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值