Pandas基础(一)

1 文件的读取和写入
1.1 文件的读取**

import pandas as pd
pd.read_csv("path")
pd.read_table("path")
pd.read_excel("path")

公共参数:
header=None:表示第一列不作为列名。
index_col:表示把某一列或者某几列作为索引。
ues_cols:表示读取列的集合,默认为全部。
read_table()函数可以使用sep参数作为分隔符。
1.2数据写入

df.to_csv("path")
df.to_excel("path")

Pandas没有to_table()函数,但是to_csv()可以保存txt文件,还可以指定分割符。
2 基本的数据结构**
2.1 Series
Series的组成:
值 data
索引 index
储存类型 dtype
序列的名字 name
对于以上属性,可以通过.的方式来获取
通过变量名.shape可以获取序列的长度
2.2DataFrame
DataFrame 在 Series 的基础上增加了列索引,一个数据框可以由二维的 data 与行列索引来构造.
DataFrame可以通过[col_name]与[col_list]来取出一个列构成Series或者多个列组成的DataFrame.
3 常用的基本函数
3.1汇总函数
head()
默认展示表格前五行
tail()
默认展示表格后五行
info()
信息概况
describe()
基本统计量
3.2 特征统计
sum()求和
mean()求均值
median()求中位数
var()求方差
std()求标准差
max()最大值
min()最小值
quantile()分位数
idxmax()最大值的索引
返回的都是标量,又称聚合函数,可以通过axis参数指定轴操作,axis=0,按列计算,axis=1,按行计算。
3.3唯一值函数
unique()
返回唯一值组成的列表
nunique()
返回唯一值的个数
values_count()
得到唯一值和对应出现的个数
drop_duplicates()
返回多个列组合的唯一值,keep=last/first,表示保留第一次出现或者最后一次出现的行。
duplicated()
参数与drop_duplicates()基本一致,唯一不同的是返回值是布尔列表,可以用于取出唯一值的行。
3.4替换函数

replace()
可以传入字典映射。
指定方法method=ffill/bfill,使用前面最近一个未被替换的值/使用后面最近一个未被替换的值。
where()与mask()
where():替换不满足条件的
mask():替换满足条件的
round():取整
abs():取绝对值
clip():clip(a,b)小于a的取a,大于b的取b,(a,b)内不改变
3.5排序函数
sort_values()
值排序
sort_index()
索引排序
参数:ascending=True/False,升序/降序。
多层索引需要指定索引层号,或者索引名
3.6apply()方法
apply()
参数:axis 指定操作方向
可接受的参数:lambda表达式、函数名
3.7窗口对象
要使用滑窗函数,就必须先要对一个序列使用 .rolling 得到滑窗对象其最重要的参数为窗口大小 window

s=pd.Series([1,2,3,4,5])
roller=s.rolling(windows=3)

还支持apply()传入自定义参数
一组滑窗对象:
shift()
diff()
pct_change()
公共参数:periods=n
分别为:
向前取n个元素的值
向前取n个元素做差
向前取n个元素算增长率
n为负表示向后操作
扩展窗口

s.expanding()

其窗口的大小就是从序列开始处到具体操作的对应位置,其使用的聚合函数会作用于这些逐步扩张的窗口上。具体地说,设序列为 a1, a2, a3, a4,则其每个位置对应的窗口即 [a1]、[a1, a2]、[a1, a2, a3]、[a1, a2, a3, a4]
整理自:https://github.com/datawhalechina/joyful-pandas

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值