1.设置一个array,并输出
import numpy as np
import pandas as pd
data = np.array([0, 7, 3, 6, 2, 8, 5, 9, 4]).reshape(3, -1)#以三行为基础重排,若-1放在reshape的第一个参数,则是列数规定,行数不限
df = pd.DataFrame(data, index=['One', 'Two', 'Three'], columns=['a', 'b', 'c'])#index设置行名,columns设置列名
df
df['a']#取出列名为a的一列
df.loc['One']#取出行名为one的一行
4.
df.loc['Two']#取出行名为'Two'的一行
df[:2]#取出前两行
6.
df.iloc[:,:2]#取出全部行和前两列
7.
list(df.columns)#取列名
8.
list(df.index)#取出行名
9.
df['b']['Two']#取出行号为b且列号为two的元素
10.
list(df.iloc[:,2])#取出索引为2的列元素并以List形式输出
11.
df.drop('a',axis=1)#drop以a为列名的那一列
12.
list(df.sum(axis=0))#输出每一列的相加之和
13.
df.iloc[:,list(df.sum(axis=0)<17)]#输出每一列相加后之和<17的列
14.
df.sort_values(by='Two',axis=1)#将行名为two的那一行从小排到大,按列排就是不能改变每一列的元素只改变顺序
15.
df.T#输出转置矩阵,就是矩阵的逆
16.
(df<=2).any(axis=0)#输出只要含有小于或等于2元素的行名
17.
df.applymap(lambda x:x*2-1)#将所有元素*2-1
18.
df.apply(lambda x:max(x),axis=1)#找出每行最大的元素并输出
小结:loc与iloc的区别:
loc按名字寻找元素,iloc按索引寻找元素