pandas用众数填充缺失值_Python通过pandas操作excel常用功能

最新推荐文章于 2024-07-15 18:08:12 发布

暴躁老哥锅得钢

最新推荐文章于 2024-07-15 18:08:12 发布

阅读量1.2k

点赞数 1

文章标签： pandas用众数填充缺失值

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33587731/article/details/111889799

版权

本文介绍了如何使用pandas在Python中处理Excel数据，包括查看数据、删除和重命名列、处理重复值、描述性统计、缺失值处理（如用众数填充）以及数据筛选等常见操作。还涉及到了时间序列处理和数据排序。

摘要由CSDN通过智能技术生成

1.导入数据源

#导入相关库

import pandas as pd

import numpy as np

import os

from pandas import DataFrame,Series

import re

df =pd.read_csv(r‘E:\work\daima\python\forestfires.csv‘) #打开文件

2.数据基本处理

1)查看列名和数据类型

print(df.columns) #查看列名

print(df.dtypes) #查看各列数据类型

2)查看指定行列数据

print(df.head(20)) #查看前20行数据

df=df.loc[:,‘FFMC‘:‘rain‘] #选择FFMC到rain列所有数据

3)删除行或列

df=df.drop([‘wind‘, ‘rain‘, ‘area‘],axis=1) #删除wind,rain和area三列

df_an=df_an.loc[-(df_an[‘qudao‘]==‘Total‘)] #删除qudao列等于‘Total‘的行

4)移除重复数据

df_new=df.drop_duplicates([‘month‘,‘day‘]) #移除month和day列包含重复值得行，保留第一个

df_new=df.drop_duplicates([‘month‘],take_last=True )#移除month列包含重复值得行，保留最后一个

5)更改列名

df.rename(columns={‘ISI‘:‘isi‘}, inplace = True) #ISI列列名改为isi

2.描述性统计

1)计算某列变量频数

print(df[‘month‘].unique()) #输出month列唯一值

print(df[‘month‘].value_counts()) #输出month列各变量出现频数

2)分段统计

bins=[0,10,20,30,40,50,60,70,80,90,100]

group_names=[‘0-10‘,‘10-20‘,‘20-30‘,‘30-40‘,‘40-50‘,‘50-60‘,‘60-70‘,‘70-80‘,‘80-90‘,‘90-100‘]

cats=pd.cut(df[‘RH‘],bins,labels=group_names)

pd.value_counts(cats,sort=False)

3)添加一列分组列，做多维频数统计

bins=[0,10,20,30,40,50,60,70,80,90,100]

group_names=[‘0-10‘,‘10-20‘,‘20-30‘,‘30-40‘,‘40-50‘,‘50-60‘,‘60-70‘,‘70-80‘,‘80-90‘,‘90-100‘]

cats=pd.cut(df[‘RH‘],bins,labels=group_names)

df_concat=pd.concat([df,cats],axis=1,ignore_index=True)

df_group=df_concat[

最低0.47元/天解锁文章

暴躁老哥锅得钢

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
pandas用众数填充缺失值_Python通过pandas操作excel常用功能

1.导入数据源#导入相关库import pandas as pdimport numpy as npimport osfrom pandas import DataFrame,Seriesimport redf =pd.read_csv(r‘E:\work\daima\python\forestfires.csv‘) #打开文件2.数据基本处理1)查看列名和数据类型print(df.column...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。