一、基本操作
s1 = pd.Series([2,4,-3,7])#创建
s2 = pd.Series([2,4,-3,7],index=['a','v','w','e'])#制作标签
二、二维数组
d1 =pd.dataFrame(np.arrange(10).reshape(2,5)) #创建从0到9,重塑2行5排
d1
2.字典形式
d_dic={'name':['Alice','Bob']}
d2 = pd.DataFrame(d_dic)
3.算术运算
c=a.mul(b,fill_value=0) #乘法缺失数据用0填充a*b
4.常用操作
inc=ina,append(inb)#连接
nd2=d2.index.delete(1)#删除1位置的
df.loc[3]=[23,'eve',19,88]#直接加一行,行是.loc
df['Rank']=[1,2,3,2]#加一rank列,反括号是列
df.insert(3,'GPA',df['score']*0.3)#插入gpa
df.drop('GPA',axis=1)#axis删除列,默认是按行删
df=df.reindex(colums=['No','name','score'])#只显示这三个标签的数据
newdf=df.colums.insert(3,'New')
newdf = df.reindex(colums=newc,fill_value='False')#用false填充
a3 = a2[a2["标签"]>3000] #筛选
三、实战
1.一开始不知道怎么对数组各个元素求和
import pandas as pd
import numpy as np
e =np.loadtxt('D:\pandas文件.csv',dtype=np.float32,delimiter=',',usecols=6,skiprows=1)
a = np.loadtxt('D:\pandas文件.csv',dtype=np.float32,delimiter=',',usecols=5,skiprows=1)
c=a+e
s1=pd.Series([c],index=['gonzi'])
print(s1)
2.后来知道定义一个求和函数
def _sum(arr,n):
return (sum(arr))
n1=len(e)
s3=_sum(e,n1)
p1=s3/12
s4=_sum(a,n1)
p2=s4/12