import pandas as pd
import csv
iris1 = pd.read_csv(‘task3_data.csv’,encoding=“gbk”)#‘utf-8’ codec can’t decode byte 0xb5 in position 0: invalid start byte
print(iris1)
print(type(iris1))
for row in iris1.iloc[0:3]:
print(type(row))
print(len(row))
print(row)
#print(iris1.iloc[1])
print(iris1.iloc[[1,2,10]])
print(iris1.loc[1])
iris1.set_index([‘Unnamed: 0’],inplace=True)
print(iris1.loc[‘1’])
print(iris1.iloc[8:11,1:3])
print(iris1.iloc[[8,9,10],1:3])
print(iris1.loc[‘a’])
print("**************")
iris4 = pd.read_csv(‘task3_data.csv’,encoding=“gbk”,index_col=[0])#‘utf-8’ codec can’t decode byte 0xb5 in position 0: invalid start byte
print(iris4)
print(type(iris4))
for row in iris4.iterrows():
print(type(row)) #tuple 内为(str,series) 分别为index和之后属性
print(len(row))
print(type(row[0])) #str
print(type(row[1])) #series
print(row[0])
print(row[1][0]) #series对象用[][]来取
print('’)
print(’///’)
for i in range(0, len(iris4)):
print(iris4.iloc[i])
print(type(iris4.iloc[i])) #series
print(type(iris4.iloc[i][1])) #series对象用[][]来取
print(’’)
#print(iris4.iloc[1])
print("******************************")
print(iris4.iloc[[1,2,10]])
print("******************************")
print(iris4.loc[[‘1’,‘2’]])
print("******************************")
print(iris4.iloc[8:11])
print("******************************")
print(iris4.loc[‘a’])
print("******************************")
iris5 = pd.read_csv(‘iris.csv’,header=None)
name=[]
for i in iris5.iloc[0]:
name.append(i)
print(name)
#第一行可以在pd.read_csv的时候 设置header=None将第一行作为数据 若不设置则第一行表示列属性
#第一列可以在pd.read_csv的时候 设置index_col[0]将第一列设置为行index(设置之后的0~n为str类型) 若不设置则默认为int的0~n 第一列作为属性的一列
s1=[]
s2=[]
s3=[]
with open(‘task3_data.csv’,‘r’) as csvfile:
iris2=csv.reader(csvfile)
print(type(iris2))
next(iris2) #过滤掉首行标题
next(iris2)
for row in iris2:
print(type(row)) #row为一个list类型
print(len(row))
print(row)
s1.append(row[0])
s2.append(row[2])
s3.append(row[3])
print(s1)
print(s2)
print(s3)
#用csv包读入 iris2可以用作迭代对象,用next(iris2)可以读取或者去掉第一行的属性
#之后在for循环中可以通过row[i]来任意选取
往csv最后追加:
data={‘accommodation_id’:[1],‘room_id’:[2],‘start_time’:[3],‘end_time’:[4],‘duration’:[5],‘start_T’:[6],‘end_T’:[7],‘mode’:[8],‘fee’:[9]}
df=pd.DataFrame(data)
df.to_csv(‘test_data.csv’, mode=‘a’, header=False,index=False)