Pandas基础操作

最新推荐文章于 2024-09-22 18:08:44 发布

XQLR

最新推荐文章于 2024-09-22 18:08:44 发布

阅读量1k

点赞数

分类专栏：基本操作文章标签： python numpy 可视化数据分析

本文链接：https://blog.csdn.net/sgsdsdd/article/details/108913517

版权

Pandas基础

文章目录

Pandas基础
一、Series
二、DataFrame
三、索引值
四、索引和选取
- loc和iloc函数讲解
五、行和列的操作
- map、apply、applymap函数讲解
- Pandas的函数应用、层级索引、统计计算
六、pandas数据可视化
七、pandas文件操作
八、pandas数据清洗与整理
八、综合案例——小费数据集

一、Series

Series讲解

from pandas import Series,DataFrame
import pandas as pd
obj = Series([1, -2, 3, -4])
#自动生产索引与之对应
type(obj)
#查看series类型
obj2 = Series([1, -2, 3, -4], index=['a', 'b', 'c', 'd'])
#生成数组，指定索引为a，b，c，d
obj2.values
#输出数组的值
obj2.index
#输出数组的索引
obj2[2]
#索引数组的第3个值
obj2[['c']]
#输出索引为c的值
obj2['c'] = 23
#改索引为c的值为23
obj2[obj2 < 0 ]
#输出所有小于0的数据
obj2 * 2
#给obj2数组所有数据×2
np.abs(obj2)
#用numpy的abs函数使数组所有数据绝对值
data = {
   
    '张三':92,
    '李四':78,
    '王五':68,
    '小明':82    
}
obj3 = Series(data)
#输出数组
obj4 = Series(data, index=names)
#按索引名输出数组
obj4.name = 'math'
obj4.index.name = 'students'
#确定数组名和索引名

二、DataFrame

import numpy as np
from pandas import Series,DataFrame
import pandas as pd
data = {
   
    'name':['张三', '李四', '王五', '小明'],
    'sex':['female', 'female', 'male', 'male'],
    'year':[2001, 2001, 2003, 2002],
    'city':['北京', '上海', '广州', '北京']
}
df = DataFrame(data)
#用DataFrame将数组转化为表格的形式
df = DataFrame(data, columns=['name', 'sex', 'year', 'city'])
#指定标签（列）值
df = DataFrame(data, columns=['name', 'sex', 'year', 'city'],index=['a', 'b', 'c', 'd'])
#指定索引值和标签值
'sex' in df.columns
#判断数据是否在标签中
'f' in df.index
#判断数据是否在索引中

三、索引值

obj = Series([1, -2, 3, -4], index=['b', 'a', 'c', 'd'])
#生成数组，设置索引值
obj2 = obj.reindex(['a', 'b', 'c', 'd', 'e'])
#重新索引，若索引值无对象，则输出NaN
obj2 = obj.reindex(range(6),method='ffill')
#向前填充
df2 = df.reindex(['a', 'b', 'c', 'd'],fill_value=0.0)
#重新索引，并将缺失值改为0.0
df3 = df2.reset_index(drop=True)
#重置索引，不想保留原来的index，使用参数 drop=True，默认 False。
df2 = df.set_index('name')
#将DataFrame 中的列转化为行索引

四、索引和选取

loc和iloc函数讲解

obj[['a','c']]
#选取索引为a和c的值
obj['a':'c']
#选取索引从a到c的值
df[['city','sex']]
#选取标签为city和sex的数组数据
df2.loc['张三']
#选取标签为张三的数据
df2.iloc[1]
#选取索引为1的数据
df2[(df2['sex'