数据预处理-数据清洗之pandas库的简单使用

最新推荐文章于 2024-09-01 16:57:39 发布

winter丶

最新推荐文章于 2024-09-01 16:57:39 发布

阅读量208

点赞数

文章标签： python pandas

本文链接：https://blog.csdn.net/qq_34212975/article/details/118996424

版权

本文介绍了如何利用Python的pandas库进行数据预处理，包括创建Series和DataFrame，理解DataFrame的索引，以及执行相关操作进行数据清洗。

摘要由CSDN通过智能技术生成

创建一个series

#导入包
import numpy as np

import pandas as pd

'''
创建series
'''
#通过数组创建一个series
np.random.seed(1234)
arr1=np.random.randint(1,10,5)
print(arr1)
ser1=pd.Series(arr1,index=['a','b','c','d','e'])
print(ser1)#index 指定索引，不指定则默认0 1 2 3 ...

#通过字典创建一个series
dict1={
   "a":1,"b":2,"c":3}
print(dict1)
ser2=pd.Series(dict1)
print(ser2)


#通过标量生成一个series
ser3=pd.Series(3,index=['a','b','c'])
print(ser3)
#一种类似广播的形式


'''
series常用属性
'''

#index
print(ser1.index)
#name
ser4=pd.Series(arr1,index=['a','b','c','d','e'],name='data')
print(ser4)
ser4.rename('haha',inplace=True)
#默认不在原数据更改，把inplace改成True就可以在原数据更改
print(ser4)

'''
series的特性
'''
#数组特性
#可以索引和切片，numpy有的操作pandas都可以
print(ser1)
print(ser1[0])
print(ser1[1:4])#切片不会得到最后一个元素
print(ser1[[1,3,4]])
print(ser1>6)
print(ser1[ser1>6])
#可以用一些numpy的函数
print(np.exp(ser1))

#字典特性
#可以通过索引标签获取和设置值
print(ser1['c'])
print(ser1['c':'e'])#标签可以获得最后一个元素
print(ser1[['a','c','d']])
ser1['a']=0#修改series的元素值
print(ser1)
print(ser1.get('b','找不着'))#默认找不到会返回None，可以手动设置

#矢量化和标签对齐
ser5=pd.Series([1,2,3,4,5],['a','b','c','d','e'])
print(ser1+ser5)
#基于标签对齐进行矢量化运算
ser6=pd.Series([1,2,3,4,5],['a','b','k','d','n'])
print(ser1+ser6)

最低0.47元/天解锁文章

winter丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
数据预处理-数据清洗之pandas库的简单使用

创建一个series#导入包import numpy as npimport pandas as pd'''创建series'''#通过数组创建一个seriesnp.random.seed(1234)arr1=np.random.randint(1,10,5)print(arr1)ser1=pd.Series(arr1,index=['a','b','c','d','e'])print(ser1)#index 指定索引，不指定则默认0 1 2 3 ...#通过字典创建一个se
复制链接

扫一扫