pandas常用方法

最新推荐文章于 2024-07-23 14:36:35 发布

陈阳羽

最新推荐文章于 2024-07-23 14:36:35 发布

阅读量85

点赞数

分类专栏：笔记文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/weixin_45764245/article/details/125670377

版权

笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

pandas常用方法

获取列数据
获取行数据
iloc 和loc 区别
index和filtering(索引和过滤)

获取列数据

建议使用方法一(有时候函数名可能和列名称冲突)
获取多列时要在中括号中附加一个中括号

import pandas as pd
#获取list.csv 中数据
a=pd.read_csv('list.csv')
#获取某一列数据
# -方法一: a['列名称']
a.name
# -方法二:a.列名称
a['name']
#获取多列数据数据
a[['name','ts_code']]

获取行数据

获取多行时需要在中括号中添加中括号

import pandas as pd
#获取list.csv 中数据
a=pd.read_csv('list.csv')
#获取某一行数据
a.loc[行索引]
#获取多行数据
a.loc[行索引列表]
#获取某一行某一列数据
a.loc[行名称,列名称]
#获取多行多列数据
a.loc[[行列表],[列的列表]]

iloc 和loc 区别

loc 是更具index进行定位
iloc 是更具column的长度来定位
注意:这里使用set_index方法来改变DateFrame的索引

import tushare as ts
import pandas as pd
pd.set_option('display.max_rows',None)
#获取list.csv 中数据
a=pd.read_csv('list.csv')
#-----------------方法一:-------------------
#获取索引长度
print(len(a.index))
#获取第一行数据行数据
b=a.loc[0]
c=a.iloc[0]
print(b,c)
#获取最后一行的数据
d=a.loc[4824] #这里的4824是根据index的长度n-1来决定的
e=a.iloc[-1]
print(d,e)
#--------------方法二:-----------------
#重置索引
a.set_index('ts_code',inplace=True)   #这里inplace 是立即重置DateFram索引
#获取第一条数据
f=a.loc['000001.SZ']      
g=a.iloc[0]
print(f,g)

index和filtering(索引和过滤)

索引排序
索引删除
设置索引
重置索引
注意: 删除和排序不会改变原来的DateFrame 会重新定义一个DateFrame

# 导入tushare
import tushare as ts
import pandas as pd
pd.set_option('display.max_rows',None)
# #获取list.csv 中数据
a=pd.read_csv('list.csv')
print(a.head())
#设置索引
a.set_index('ts_code',inplace=True)  #表示立即重置
print(a.head())
#根据设置索引排序
b=a.sort_index(ascending=False) #ascending 是否为正序排序
print(b.head(),a.head())
# 根据索引删除行或者列
c=a.drop('000001.SZ',axis=0)   #axis 值为0删除行  值为1产出列
print(c.head(),a.head())
#恢复重置索引
a.reset_index(inplace=True) #表示立即重置