dataframe 根据条件查找_python处理DataFrame数据的一些常用操作

最新推荐文章于 2024-06-10 01:00:00 发布

阿躿

最新推荐文章于 2024-06-10 01:00:00 发布

阅读量5.1k

点赞数 2

文章标签： dataframe 根据条件查找

本文链接：https://blog.csdn.net/weixin_30666751/article/details/112264481

版权

前言

在算法开发的工作中，很大一部分工作是进行数据分析。我们需要分析原始数据分布、算法效果回收等。这样的数据大部分都是结构化的数据，在Python中常用的处理结构化数据的工具包为Pandas、Numpy。本文将汇总的Python中处理DataFrame数据的一些常用操作进行介绍。

数据

为了方便大家，这里将脱敏后的数据提供出来：

链接：https://pan.baidu.com/s/1-uUOZfVHohfJU9JNRO2opA

提取码: gckq

一段注释比代码多的代码

这里将处理DataFrame数据时一些常用的操作以代码的形式进行演示，包含了一些函数的基本用法。

import pandas as pd
import numpy as np
df = pd.read_csv('gzh.csv',encoding='utf8',sep='\t',usecols=['team_name','phone','num','rate1','rate2']) #默认第一行是表头

#查看df的维度
print(df.shape)
#查看表数据的基础信息
print(df.info())
#查看每一列数据的格式
print(df.dtypes)
#验证空值
print(df.isnull())
#验证nan值
print(df.isna())
#注意：上述结果看来isnnull()和isnan()的结果是一样的，后面会讲两者的不同
#查看数据表的值
print(df.values)
print(type(df.values))#数据类型为：numpy.ndarray
#查看列名称
print(df.columns)
#查看前、后n行数据
print(df.head(6))
print(df.tail(6))  #默认前、后10行
#空值填充
print('111111')
print(df.fillna(value=0))
#使用rate2的均值对rate2的NaN进行填充
print(df['rate2'].fillna(df['rate2'].mean()))
#对不同的列的NaN分别进行填充

#遍历DataFrame的每一行
#方法1：
for index, row in df.iterrows():
 print('index：',index) # 输出每行的索引值
 print('row2：',row['team_name'])
 break
#df.iterrows()返回的是一个元组:(index,data)

#方法2：
for row in df.itertuples():
 print('方法2：')
 print(getattr(row, 'team_

最低0.47元/天解锁文章

阿躿

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
dataframe 根据条件查找_python处理DataFrame数据的一些常用操作

前言在算法开发的工作中，很大一部分工作是进行数据分析。我们需要分析原始数据分布、算法效果回收等。这样的数据大部分都是结构化的数据，在Python中常用的处理结构化数据的工具包为Pandas、Numpy。本文将汇总的Python中处理DataFrame数据的一些常用操作进行介绍。数据为了方便大家，这里将脱敏后的数据提供出来：链接：https://pan.baidu.com/s/1-uUOZ...
复制链接

扫一扫