python自带的csv库也可以对csv文件进行操作,但是操作起来不是很方便,我们试着用pandas库来试试
读取
pandas库里读取csv文件后可以直接返回dataframe对象,不需要我们再转
data = pd.read_csv(file,encoding="utf-8")
print(type(data))
#output
<class 'pandas.core.frame.DataFrame'>
我们可以看到输出的类型是个dataframe对象
我们也可以加上参数固定的读取某列的数据
data = pd.read_csv(file,usecols=[1,3])
这个列表的参数就是我们要读取的列序号
遍历
pandas可以直接按照列的标题去遍历,假如说我现在有两列数据,标题分别是name,age,那么我们读取之后就可以这样操作
for one in data.loc[:'name']
print(one)
这里简单提一下loc函数,loc函数是按标签遍历,这里就是name,还有一个和他很像的函数iloc,iloc函数为Selection by Position,即按位置选择数据,即第n行,第n列数据,只接受整型参数,例如data.iloc[:, 0]
修改
这里我们假如要将指定的人(“jack”)的年龄加1,废话不多说,直接看代码
for one in data.loc[:,"name"]:
data.loc[data['name']=="tack",'age']=age+1
data.to_csv(file)
这里强调一下,修改完后一定要记得把数据更新到csv文件中,不然原文件里的数据是不会改变的。
这样看起来是要比python自带的csv库操作起来要简单的多