Pandas读取数据
import pandas as pd
import numpy as np
dates = pd.date_range('20210101', periods=6)
df = pd.DataFrame(np.arange(24).reshape((6,4)),index=dates, columns=['A','B','C','D'])
print(df)
#获取DataFrame中的数据
print(df['A'])
print(df.A)
#获取的是A列的数据
print(df[0:3])#跨越多行或多列
#跟据标签loc获取数据
print(df.loc['20130102'])
print(df.loc[:,['A','B']]) #获取所有行的A,B列
print(df.loc['20130102',['A','B']])#获取该行的A、B列
#跟据序列iloc
print(df.iloc[3,1])#第四行第二列
print(df.iloc[3:5,1:3])
print(df.iloc[[1,3,5],1:3])
#采用判断指令进行选择. 约束某项条件然后选择出当前所有数据.
print(df[df.A>8])
print(df[df>8])
Pandas导入数据
pandas
可以读取与存取的资料格式有很多种,像csv
、excel
、json
、html
与pickle
等…
import pandas as pd #加载模块
#读取csv
data = pd.read_csv('student.csv')
#打印出data
print(data)
合并concat
pandas
处理多组数据的时候往往会要用到数据的合并处理,使用 concat
是一种基本的合并方式.而且concat
中有很多参数可以调整,合并成你想要的数据形式.
axis=0
是预设值,因此未设定任何参数时,函数默认axis=0,纵向合并。
import pandas as pd
import numpy as np
#定义资料集
df1 = pd.DataFrame(np.ones((3,4))*0, columns=['a','b','c','d'])
df2 = pd.DataFrame(np.ones((3,4))*1, columns=['a','b','c','d'])
df3 = pd.DataFrame(np.ones((3,4))*2, columns=['a','b','c','d'])
#concat纵向合并
res = pd.concat([df1, df2, df3], axis=0)
print(res)
结果:
res = pd.concat([df1, df2, df3], axis=0, ignore_index=True)
#打印结果
print(res)
可视化
import pandas as pd
import numpy as np
import matplotlib.pyplot as plot
# 随机生成1000个数据
data = pd.Series(np.random.randn(100), index=np.arange(100))
# 为了方便观看效果, 我们累加这个数据
data.cumsum()
# pandas 数据可以直接观看其可视化形式
data.plot()
plot.show()
https://blog.csdn.net/weixin_39777626/article/details/78598346