pandas学习(一)

本文介绍了pandas的基础知识,包括Series和DataFrame的数据类型,如何修改dtype,进行切片和索引操作,读取外部数据如CSV,以及处理缺失数据。还探讨了布尔索引和字符串方法在pandas中的应用。
摘要由CSDN通过智能技术生成

为什么要学pandas

numpy只能够帮助处理数值型数据

pandas还可以处理其他数据,如字符串,时间序列

pandas的常用的数据类型

1.Series,一维,带标签数组
2.DataFrame,二维,Series容器

先来看看Series

什么是带标签?

我们先来创建一个Series数组

import pandas as pd

t = pd.Series([1,3,4,5])

print(type(t))

print(t)

在这里插入图片描述

其实标签就是索引

但是这索引可以指定,可以为字符串

import pandas as pd

t = pd.Series([1,3,4,5],index=list('abcd'))

print(t)

在这里插入图片描述


还可以通过字典来创建一个Series

import pandas as pd

temp_dict = {'name':'xiaoming','age':30,'tel':12345}

t = pd.Series(temp_dict)

print(t)

在这里插入图片描述

修改dtype

.astype('int')

和numpy中一样

Series的切片和索引

和numpy中一样

import pandas as pd

temp_dict = {'name':'xiaoming','age':30,'tel':12345}

t = pd.Series(temp_dict)

print(t)
print("*"*50)

# 取某行,通过标签或者索引都可以
print(t['age'])
print(t[0])

print("*"*50)

# 取连续多行
print(t[1:])

print("*"*50)
# 取不连续的多行
print(t[[0,2]])

在这里插入图片描述


bool 索引

import pandas as pd

t = pd.Series(range(10))
print(t)

print(t[t<5])

在这里插入图片描述


Series索引和值

Series可以取出索引和值

import pandas as pd

t = pd.Series(range(5),index=['a','b','c','d','e'])
print(t)

print(t.index)
print(type(t.index))
print(t.values)
print(type(t.values))

在这里插入图片描述
numpy中很多方法都使用与pandas中

pandas读取外部数据

可以读取数据库,excel,csv等很多文件

比如读取csv文件

pd.read_csv('file_path')

DataFrame

创建DataFrame

import pandas as pd
import numpy as np

t = pd.DataFrame(np.arange(12).reshape(3,4))

print(t)

不仅有行索引index

还有列索引columns
在这里插入图片描述

指定索引

import pandas as pd
import numpy as np

t = pd.DataFrame(np.arange(12).reshape(3,4),index=list('abc'),columns=list('wxyz'))

print(t)

在这里插入图片描述


通过字典创建DataFrame

import pandas as pd

d = {'name':['hong','ming'],'age':[20,30],'tel':[10043,12345]}

t = pd.DataFrame(d)
print(t)

在这里插入图片描述

每一行是一条记录,每一列的数据类型相同

如果有些值是缺失的,那么对应的值为 NaN

DataFrame中描述信息

在这里插入图片描述

排序
df.sort_values(by='列索引')

DataFrame索引和切片

取行,取前20行 df[:20]

取列,df["列索引"]

方括号写数字表示行,字符串表示列


同是对行和列操作

df.loc 通过标签索引获取数据
df.iloc 通过位置索引获取数据

注意是闭合的

在这里插入图片描述在这里插入图片描述


pandas之布尔索引

在这里插入图片描述

pandas之字符串方法

在这里插入图片描述

缺失数据处理

数据缺失通常有两种情况:

一种就是空,None等,在pandas是NaN(和np.nan一样)
另一种就是我们让其为0

判断数据是不是Nan: pd.isnull(df) , pd.notnull(df)

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值