CSV与PD

最新推荐文章于 2024-05-08 11:35:17 发布

weixin_43584808

最新推荐文章于 2024-05-08 11:35:17 发布

阅读量238

点赞数

文章标签： python

本文链接：https://blog.csdn.net/weixin_43584808/article/details/106358660

版权

import pandas as pd
import csv

iris1 = pd.read_csv(‘task3_data.csv’,encoding=“gbk”)#‘utf-8’ codec can’t decode byte 0xb5 in position 0: invalid start byte
print(iris1)
print(type(iris1))
for row in iris1.iloc[0:3]:
print(type(row))
print(len(row))
print(row)
#print(iris1.iloc[1])
print(iris1.iloc[[1,2,10]])
print(iris1.loc[1])
iris1.set_index([‘Unnamed: 0’],inplace=True)
print(iris1.loc[‘1’])
print(iris1.iloc[8:11,1:3])
print(iris1.iloc[[8,9,10],1:3])
print(iris1.loc[‘a’])

print("**************")
iris4 = pd.read_csv(‘task3_data.csv’,encoding=“gbk”,index_col=[0])#‘utf-8’ codec can’t decode byte 0xb5 in position 0: invalid start byte
print(iris4)
print(type(iris4))
for row in iris4.iterrows():
print(type(row)) #tuple 内为（str，series）分别为index和之后属性
print(len(row))
print(type(row[0])) #str
print(type(row[1])) #series
print(row[0])
print(row[1][0]) #series对象用[][]来取
print('’)

print(’///’)
for i in range(0, len(iris4)):
print(iris4.iloc[i])
print(type(iris4.iloc[i])) #series
print(type(iris4.iloc[i][1])) #series对象用[][]来取

print(’’)
#print(iris4.iloc[1])
print("******************************")
print(iris4.iloc[[1,2,10]])
print("******************************")
print(iris4.loc[[‘1’,‘2’]])
print("******************************")
print(iris4.iloc[8:11])
print("******************************")
print(iris4.loc[‘a’])
print("******************************")

iris5 = pd.read_csv(‘iris.csv’,header=None)
name=[]
for i in iris5.iloc[0]:
name.append(i)
print(name)

#第一行可以在pd.read_csv的时候设置header=None将第一行作为数据若不设置则第一行表示列属性
#第一列可以在pd.read_csv的时候设置index_col[0]将第一列设置为行index（设置之后的0~n为str类型）若不设置则默认为int的0~n 第一列作为属性的一列

s1=[]
s2=[]
s3=[]
with open(‘task3_data.csv’,‘r’) as csvfile:
iris2=csv.reader(csvfile)
print(type(iris2))
next(iris2) #过滤掉首行标题
next(iris2)
for row in iris2:
print(type(row)) #row为一个list类型
print(len(row))
print(row)

s1.append(row[0])

s2.append(row[2])

s3.append(row[3])

print(s1)
print(s2)
print(s3)

#用csv包读入 iris2可以用作迭代对象，用next（iris2）可以读取或者去掉第一行的属性
#之后在for循环中可以通过row[i]来任意选取

往csv最后追加：
data={‘accommodation_id’:[1],‘room_id’:[2],‘start_time’:[3],‘end_time’:[4],‘duration’:[5],‘start_T’:[6],‘end_T’:[7],‘mode’:[8],‘fee’:[9]}

df=pd.DataFrame(data)
df.to_csv(‘test_data.csv’, mode=‘a’, header=False,index=False)