Pandas常用方法

参考文章

from Pandas as pd
  1. pd.read_csv()
  2. pd.read_excel(‘1.xlsx’,sheet_name=[‘python’,‘student’])
  3. pd.DataFrame(result, columns=head)
  4. pd.to_excel()
  5. pd.to_sql(‘test_cjk’,engine 1,if_exists=‘replace’,index = False)
  1. pd.date_range(start=‘20170102’, periods=7, freq=“y”)
  2. pd.Timestamp(‘20170102’)

  1. pd.isnull() # 检查空值
  2. pd.notnull()
from Numpy as np
  1. np.array([3] * 4, dtype=‘int32’)
  2. np.random.randn(7,4) # 正太分布
  3. np.random.rand(20,5) # 20行5列
DataFrame
  1. df.head()
  2. df.tail()
  3. df.index
  4. df.columns
  5. df.values
  6. df.describe() # 查看数值型列的汇总统计
  7. df.shape # 查看行数和列数
  8. df.sort_index(axis=1, ascending=False)
  9. df.sort_values(by=‘B’)
  10. df.rename(columns={‘old_name’: ‘new_ name’}) # 选择性更改列名
  11. df.set_index(‘column_one’) # 更改索引列
  12. df.to_dict(‘records’) # 转化为字典 ‘dict’, ‘list’, ‘series’, ‘split’, ‘records’, ‘index’

  1. df.loc[行,列]
  2. df.loc[‘index_one’] # 按索引选取数据
  3. df[[列1,列2]],df[列]
  4. df.iloc[0,:] # 返回第一行
  5. df.iloc[0,0] # 返回第一列第一个元素

  1. df.dropna() # 删除所有包含空值的行
  2. df.dropna(axis=1) # 删除所有包含空值的列
  3. df.dropna(axis=1,thresh=n) # 删除所有小于n个非空值的行
  4. df.fillna(x) # 用x替换DF对象中所有的空值

  1. df[df[col] > 0.5]
  2. df.sort_values(col1, ascending=False)
  3. df.sort_values([col1, col2], ascending=[True, False])
  4. df.groupby(col) # df.groupby([col1, col2])
  5. df.apply(np.mean) # 对DF中的每一列应用函数

  1. df.max(),df.min(),df.std(),df.count()
Series
  1. s.astype(float) # 将Series中的数据类型更改为float类型
  2. s.replace(1,‘one’) # 用‘one’代替所有等于1的值
  3. s.replace([1,3],[‘one’,‘three’]) # 用’one’代替1,用’three’代替3

  1. from sqlalchemy import create_engine engine = create_engine(f’mysql+pymysql://root:root@localhost:3306/test?charset=utf8’, encoding=“utf-8”) ↩︎

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值