Pandas常用方法

最新推荐文章于 2023-06-17 15:43:06 发布

余生在风里

最新推荐文章于 2023-06-17 15:43:06 发布

阅读量98

收藏

点赞数

文章标签： Pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w1992727/article/details/102740135

版权

参考文章

from Pandas as pd

pd.read_csv()
pd.read_excel(‘1.xlsx’,sheet_name=[‘python’,‘student’])
pd.DataFrame(result, columns=head)
pd.to_excel()
pd.to_sql(‘test_cjk’,engine ¹,if_exists=‘replace’,index = False)

pd.date_range(start=‘20170102’, periods=7, freq=“y”)
pd.Timestamp(‘20170102’)

pd.isnull() # 检查空值
pd.notnull()

from Numpy as np

np.array([3] * 4, dtype=‘int32’)
np.random.randn(7,4) # 正太分布
np.random.rand(20,5) # 20行5列

DataFrame

df.head()
df.tail()
df.index
df.columns
df.values
df.describe() # 查看数值型列的汇总统计
df.shape # 查看行数和列数
df.sort_index(axis=1, ascending=False)
df.sort_values(by=‘B’)
df.rename(columns={‘old_name’: ‘new_ name’}) # 选择性更改列名
df.set_index(‘column_one’) # 更改索引列
df.to_dict(‘records’) # 转化为字典 ‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’

df.loc[行,列]
df.loc[‘index_one’] # 按索引选取数据
df[[列1,列2]],df[列]
df.iloc[0,:] # 返回第一行
df.iloc[0,0] # 返回第一列第一个元素

df.dropna() # 删除所有包含空值的行
df.dropna(axis=1) # 删除所有包含空值的列
df.dropna(axis=1,thresh=n) # 删除所有小于n个非空值的行
df.fillna(x) # 用x替换DF对象中所有的空值

df[df[col] > 0.5]
df.sort_values(col1, ascending=False)
df.sort_values([col1, col2], ascending=[True, False])
df.groupby(col) # df.groupby([col1, col2])
df.apply(np.mean) # 对DF中的每一列应用函数

df.max(),df.min(),df.std(),df.count()

Series

s.astype(float) # 将Series中的数据类型更改为float类型
s.replace(1,‘one’) # 用‘one’代替所有等于1的值
s.replace([1,3],[‘one’,‘three’]) # 用’one’代替1，用’three’代替3

from sqlalchemy import create_engine engine = create_engine(f’mysql+pymysql://root:root@localhost:3306/test?charset=utf8’, encoding=“utf-8”) ↩︎

余生在风里

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值