几个pandas数据处理中的常用操作

记几个常用的函数,具体用法去官网查啦

import的惯例:

import pandas as pd
from pandas import Series,DataFrame

显示一些数字特征:

df.describe()#显示很多,均值,标准差,分位数等等
df.quantile(0.75)#显示3/4分位数
df.std()#显示标准差,样本标准差?

读取存在csv中的dataframe,,还有把Series,DataFrame存为csv:

pd.read_table()#读table分割的,但是有时不管用= =,还不清楚为什么
pd.read_csv()
df.to_csv('xx.csv')
操作一列数据,这是把num列的格式转为int

df['num'] = df['num'].apply(lambda x:int(x))

去重,直接调用只是返回一个视图,要赋值才能覆盖原来的列,pandas许多时候都是这种情况

df['num'].drop_duplicates()
重要的groupby,下面这条的意思是取每个星期week()的总数(相同week的count之和(sum)),具体现在还不清楚,只会算个平均数求个和:

week_count = df['count'].groupby(df['week']).sum()
groupby([df['1'],df[]'2'])后会出现层次化索引,把层次化索引重新安排到DataFrame中需要使用unstack()方法,想回去就用stack()

df.unstack()
df.stack()
填充缺失值NaN,这里是填充成0:

df.fillna(value=0)
画图用plot,想画多个图可以用matplotlib弄个plt.subplot(x,x,x)之后画,画图时用kind选择画什么图,例如:bar:柱状图,pie饼图
    plt.subplot(1,1,1)
    df[index].plot(kind='bar',title=index)


刚看两天,现在常用的也就这些。。

pandas把数据存到内存里,很多变量可能会有memoryerror

pandas快速入门:http://www.cnblogs.com/chaosimple/p/4153083.html

还有本书叫《利用Python进行数据分析》

主要的是官方文档了,虽然看不懂,感觉能用就用一下

在进行Pandas数据处理的过程,可以按照以下几个步骤进行: 1. 导入数据:首先需要导入Pandas库,使用`import pandas as pd`语句进行导入。然后可以使用`pd.read_xxx()`函数来读取不同格式的数据文件,如CSV、Excel等。\[1\] 2. 查看数据:可以使用`df.head()`函数来查看数据的前几行,默认显示前5行。也可以使用`df.tail()`函数来查看数据的后几行。\[1\] 3. 数据选取:可以使用`df\['column_name'\]`来选取某一列的数据,也可以使用`df.loc\[row_index, column_name\]`来选取某一行或某个单元格的数据。\[1\] 4. 数据处理:可以使用各种Pandas提供的函数和方法对数据进行处理,如数据清洗、缺失值处理、数据转换等。常用的函数包括`df.dropna()`、`df.fillna()`、`df.replace()`等。\[1\] 5. 数据分组和排序:可以使用`df.groupby()`函数对数据进行分组,然后使用聚合函数对每个组进行计算。可以使用`df.sort_values()`函数对数据进行排序。\[1\] 6. 数据合并:可以使用`pd.merge()`函数将不同DataFrame的行连接起来,类似于数据库的join操作。可以根据一个或多个键进行连接。\[3\] 综上所述,Pandas数据处理的过程包括导入数据、查看数据、数据选取、数据处理、数据分组和排序以及数据合并等步骤。 #### 引用[.reference_title] - *1* [总结了这67个pandas函数,完美解决数据处理,拿来即用!](https://blog.csdn.net/weixin_41261833/article/details/115598697)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [Pandas数据处理与分析](https://blog.csdn.net/qq_40195360/article/details/84570503)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值