获取列数据
- 建议使用方法一(有时候函数名可能和列名称冲突)
- 获取多列时要在中括号中附加一个中括号
import pandas as pd
a=pd.read_csv('list.csv')
a.name
a['name']
a[['name','ts_code']]
获取行数据
import pandas as pd
a=pd.read_csv('list.csv')
a.loc[行索引]
a.loc[行索引列表]
a.loc[行名称,列名称]
a.loc[[行列表],[列的列表]]
iloc 和loc 区别
- loc 是更具index进行定位
- iloc 是更具column的长度来定位
- 注意:这里使用set_index方法来改变DateFrame的索引
import tushare as ts
import pandas as pd
pd.set_option('display.max_rows',None)
a=pd.read_csv('list.csv')
print(len(a.index))
b=a.loc[0]
c=a.iloc[0]
print(b,c)
d=a.loc[4824]
e=a.iloc[-1]
print(d,e)
a.set_index('ts_code',inplace=True)
f=a.loc['000001.SZ']
g=a.iloc[0]
print(f,g)
index和filtering(索引和过滤)
- 索引排序
- 索引删除
- 设置索引
- 重置索引
- 注意: 删除和排序不会改变原来的DateFrame 会重新定义一个DateFrame
import tushare as ts
import pandas as pd
pd.set_option('display.max_rows',None)
a=pd.read_csv('list.csv')
print(a.head())
a.set_index('ts_code',inplace=True)
print(a.head())
b=a.sort_index(ascending=False)
print(b.head(),a.head())
c=a.drop('000001.SZ',axis=0)
print(c.head(),a.head())
a.reset_index(inplace=True)